WO2019085697A1

WO2019085697A1 - 人机交互方法和系统

Info

Publication number: WO2019085697A1
Application number: PCT/CN2018/107893
Authority: WO
Inventors: 谢韬
Original assignee: 科沃斯商用机器人有限公司
Priority date: 2017-10-31
Filing date: 2018-09-27
Publication date: 2019-05-09
Also published as: CN109726387A

Abstract

本申请实施例提供一种人机交互方法和系统，所述方法包括：将用户的语音输入信息识别为对应的用户文本信息；根据所述用户文本信息和意图节点标签，基于意图树节点群，通过意图分类器及对应的数据处理确定最佳意图；根据所述最佳意图，查询意图与输出信息的对照表，得到对应的输出信息；和输出所述输出信息。所述系统包括语音识别模块、最佳意图确定模块、查询模块和输出模块。本申请实施例采用意图树回溯机制，提高了对用户意图的识别准确率，操作简单、系统响应快速。

Description

人机交互方法和系统

交叉引用

本申请引用于2017年10月31日递交的名称为“人机交互方法和系统”的第201711054329.6号中国专利申请，其通过引用被全部并入本申请。

技术领域

本申请涉及自动应答系统技术领域，具体地说，涉及一种人机交互方法和系统。

背景技术

随着社会发展，实现各类功能的机器人在社会中扮演着越来越多角色。在一些服务行业，友好、高效的人机交互显得尤为重要。在诸多的人机交互方式，如触控交互、体感交互、文字方式、语音方式等中，文字和语音为最为常见的交互方式。例如银行系统中使用的ATM机、零售业中付款时使用的刷卡机等等，多使用文字交互方式，为人机交流提供了准确的问答信息。然而相对于语音方式，文字方式的人机交互存在一定的限制，例如当使用人群为儿童、具有一定阅读障碍的人群时，文字方式的人机交互不能为这类群体提供有效的服务。相对而言，语音方式则是一种比较理想、直接、方便的人机交互方式。因而目前市面上人机交互系统中的问答系统，多采用语音交互方式。即用户提出问题，系统对用户的问题做出响应，以语音的方式给出相应的答案，有的还同时伴随着其他相应的操作。

然而，由于在目前的技术中，对语义理解仍然存在很多的技术难点，因而上述的问答系统大部分停留在浅层的对话系统，通常只能根据特定的用户指令在系统数据库中对用户指令进行简单的匹配，从而给出相应的语音响应，这种模式的人机交互和人与人的交流相去甚远，远不能满足用户的需求。

为了提高对用户语音输入的语义理解，业界做出了很多技术尝试。例如，通过语音识别、语义合成等技术，突破传统系统中一定要输入特定的语音指令的语音输入方式，可以基于自然语言进行人机交互。然而，由于大多数的这类系统采用基于语法的自然语言理解，虽然可以实现语义理解的功能，但是自然语言中的口语很多时候是不规则的，甚至不符合语法，这就导致了识别的失败或错误。

另有通过语义网络对用户输入的语音信号进行语义匹配，其主要是通过一些预设的语义关系库和句型关系模板等，对语义分析的内容进行语义匹配。这种方法对用户使用的语言有较高限制，一旦出现没有经过预设的指令，则很难识别。

公告号为104360994A、发明名称为一种自然语言理解方法及系统的发明专利申请提供了另外一种方案，采用Ranking SVM(基于支持向量机的排序学习算法)，对文本提取特征向量，然后采用线性核的SVM，实现基于统计的排序，对多场景语义解析结果与用户输入的自然语言之间的相关度进行排序。该方法的不足在于：容易受噪声干扰，且容易产生过拟合，因而对自然语言的理解不够准确。

公告号为CN106156003A、发明名称为一种问答系统的问句理解方法的发明专利申请提供了一种槽填充的方法来获得问句的理解，具体方案是：通过循环神经网络建模一同解决问句中的意图识别任务和槽填充任务，提高问句理解的准确率。但是槽填充相关技术在使用时，需要对句子进行分析，判断属于什么事件、抽取其中的实体、查找满足的槽等等操作，在实现上相对复杂，且只能解决同一话题内的对话，无法实现话题的转换。

发明内容

本申请所要解决的技术问题在于，针对现有人机交互技术中对用户意图的理解不够准确，提供一种人机交互方法和系统，用于实现准确的人机交流。

本申请通过如下技术方案解决了上述的技术问题：

一种人机交互方法，包括以下步骤：

将用户的语音输入信息识别为用户文本信息；

根据所述用户文本信息和意图节点标签，基于意图树节点群，通过意图分类器及对应的数据处理确定最佳意图；

根据所述最佳意图，查询意图与输出信息的对照表，得到对应的输出信息；和

输出所述输出信息。

其中，在上述方法中，所述根据所述用户文本信息和意图节点标签，基于意图树节点群，通过意图分类器及对应的数据处理确定最佳意图的步骤具体包括：

获取当前意图节点标签。

从所述意图树节点群中确定从当前意图节点到根意图节点的节点分支；

将所述用户文本信息和意图节点标签合并为意图分类器的输入信息；

通过将意图分类器输入信息中的意图节点标签替换为所述节点分支中的意图节点标签，利用所述意图分类器得到对应的预测意图；

验证所述预测意图是否符合用户意图，将符合用户意图的预测意图确定为最佳意图。

在前述方法中，将意图分类器输入信息中意图节点标签替换为所述分支中的意图节点标签时，从当前意图节点开始，到根意图节点结束，分别用每一个节点的意图节点标签替换意图分类器输入信息中的意图节点标签，得到多个对应的预测意图；

验证所述预测意图是否符合用户意图的步骤包括：

查找意图与预置输入信息的对照表，得到与每一预测意图对应的预置输入信息；

计算用户文本信息与对应的预置输入信息的相似度，获得对应每一预测意图的最大相似度；

比较所述多个预测意图的最大相似度的分值大小，将分值最大的最大相似度确定为全局最大相似度；和

比较所述全局最大相似度和第一阈值的大小，如果所述全局最大相似度大于或等于所述第一阈值，则确定与所述全局最大相似度对应的预测意图符合用户意图。

其中，如果所述全局最大相似度小于所述第一阈值，或者获取对应的特定输出信息，并输出所述特定输出信息；或者向第三方系统发送交互请求；接收第三方系统返回的第三方交互输出信息；和输出所述第三方交互输出信息。

其中，将意图分类器输入信息中意图节点标签替换为所述节点分支中的意图节点标签时，从当前意图节点开始，用当前意图节点标签替换意图分类器输入信息中的意图节点标签，得到对应的预测意图；

验证所述预测意图是否符合用户意图的步骤包括：

查找意图与预置输入信息的对照表，得到与所述预测意图对应的预置输入信息；

计算用户文本信息与对应的预置输入信息的相似度，得到对应所述预测意图的最大相似度；

比较所述预测意图的最大相似度和第二阈值的大小，如果所述预测意图的最大相似度大于或等于第二阈值，则确定所述预测意图符合用户意图；

如果所述预测意图的最大相似度小于所述第二阈值，将意图分类器输入信息中意图节点标签替换所述分支中当前意图节点的上一级节点的意图节点标签，重复上述步骤。

当将意图分类器输入信息中意图节点标签替换为根意图节点标签时得到的对应最大相似度小于所述第二阈值时，根据已计算得到的多个预测意图的最大相似度，比较所述多个预测意图的最大相似度的分值大小，将分值最大的最大相似度确定为全局最大相似度；和

比较所述全局最大相似度和第一阈值的大小，如果所述全局最大相似度大于或等于所述第一阈值，则确定与所述全局最大相似度对应的预测意图符合用户意图；如果所述全局最大相似度小于所述第一阈值，或者获取对应的特定输出信息；并输出所述特定输出信息；或者向第三方系统发送交互请求；接收第三方系统返回的第三方交互输出信息；和向用户输出所述第三方交互输出信息。

为方便下一次交互可以快速得到当前意图节点，在将符合用户意图的预测意图确定为最佳意图后，将所述最佳意图对应的节点确定为当前意图节点。

其中，将所述最佳意图对应的节点确定为当前意图节点的过程包括：

在所述意图树的节点标签集中搜索所述最佳意图节点标签，得到最佳意图节点路径；

当最佳意图节点路径为多个时，将路径长度最大的最佳意图节点确定为当前意图节点。

在前述方法中，将所述用户文本信息和意图节点标签合并为意图分类器的输入信息的步骤具体包括：

将所述的用户文本信息和意图节点标签合并为新的文本信息；

对所述新的文本信息进行分词和文本向量化处理，得到对应的词向量；和

将所述词向量作为意图分类器的输入信息。

在前述方法中，所述意图分类器为卷积神经网络模型或循环神经网络模型。

本申请还提供了一种人机交互系统，包括：

语音识别模块，用于将用户的语音输入信息识别为用户文本信息；

最佳意图确定模块，用于根据所述用户文本信息和意图节点标签，基于意图树的节点群，利用意图分类器及对应的数据处理确定最佳意图；

查询模块，用于根据所述最佳意图，查询意图与输出信息的对照表，得到对应的输出信息；和

输出模块，用于输出所述输出信息。

其中，所述最佳意图确定模块包括：

合并单元，用于合并所述的用户文本信息和意图节点标签；

意图分类器，用于以所述合并单元的合并信息为输入信息，得到预测意图；

验证单元，用于验证所述预测意图是否符合用户意图；和

确定单元，用于将符合用户意图的预测意图确定为最佳意图。

其中，所述验证单元包括：

查找子单元，用于根据意图分类器输出的预测意图，查找意图与预置输入信息的对照表，得到与每一预测意图对应的预置输入信息；

相似度计算子单元，用于计算用户文本信息与对应的预置输入信息的相似度，获得对应预测意图的最大相似度；和

阈值比较子单元，用于比较所述最大相似度与阈值的大小，并将比较结果发送给所述确定单元。

其中，所述合并单元包括通知接收接口，用于接收合并通知；对应地，所述意图分类器包括通知输出接口，用于输出合并通知；或者所述相似度计算子单元包括通知输出接口，用于向所述合并单元发送合并通知；或者所述阈值比较子单元包括通知输出接口，用于向所述合并单元发送合并通知。

本申请所述系统还包括当前意图节点维护模块，用于在最大相似度小于阈值时，保留当前意图节点；在确定了最佳意图时，将最佳意图节点路径中路径长度最大的最佳意图节点确定为当前意图节点。

本申请所述系统还包括第三方接口模块，与所述最佳意图确定模块相连接，用于在所述最佳意图确定模块确定没有最佳意图时，将所述用户文本信息和交互请求发送给第三方系统，并接收第三方系统返回的输出信息，将所述输出信息发送给所述输出模块。

本申请采用意图树回溯机制，提供了一种操作简单、系统处理快速、响应准确的人机交互方法和系统，只需要标注垂直领域内语料的意图及上级意图，无需其它通用语料的标注，节省了大量的注标处理时间。在具体实现过程中，只需要用分类器预测意图，并采用回溯机制寻找最优的节点便可以得到准确的输出信息。能够实现业务内同一主题下交互和不同主题下的话题切换和交互，通过与第三方系统的通信，能够实现业务外话题的切换，为用户提供不同话题的回复信息，本申请可以应用在用户意图明确、事务的完成有很清晰步骤的垂直领域，如银行、法院、医院等。

下面结合附图和具体实施例，对本申请的技术方案进行详细地说明。

附图说明

图1为本申请所述人机交互方法的总体流程图；

图2为本申请意图树的一个实施例的关系示意图；

图3为本申请所述人机交互方法中确定最佳意图的方法流程图；

图4为本申请所述人机交互方法中确定最佳意图的另一方法流程图；

图5为本申请所述人机交互系统的原理框图；

图6为本申请所述最佳意图确定模块的原理框图；

图7为最佳意图确定模块实施例一的原理框图；

图8为最佳意图确定模块实施例二的原理框图；

图9为本申请所述人机交互系统的另一原理框图；

图10为本申请意图树的另一个实施例的关系示意图；

图11为本申请应用实施例一中的意图树及其回溯过程示意图。

具体实施方式

图1为本申请人机交互方法的总体流程图。如图1所示，本申请所述的人机交互方法包括以下步骤：

步骤S1、将用户的语音输入信息识别为用户文本信息；

步骤S2、根据所述用户文本信息和意图节点标签，基于意图树节点群，通过意图分类器及对应的数据处理确定最佳意图；

步骤S3、根据所述最佳意图，查询意图与输出信息的对照表，得到对应的输出信息；和

步骤S4、输出所述输出信息。

其中，在所述步骤S1中，通过语音识别技术，将用户输入的语音信息识别为对应的用户文本信息，便于后续的处理。由于语音识别技术已为很成熟的技术，因而，本申请不再展开说明，本领域的技术人员可以参照目前的任意一种语音识别技术来完成。

步骤S2中的意图树为系统数据库中存储的意图树。在本申请中，所述的意图树包括多个呈上、下级关系的节点，每一个节点以意图节点标签的形式标注，并在系统中记录每一节点的路径，从而确定节点在意图树中的位置。

如图2所示，为本申请意图树的一个实施例的关系示意图，本实施例以垂直领域中的银行系统为例。在该实施例中，共列出了四级意图节点，最高一级为根意图节点Root，其下一级包括“存款”、“取款”和“贷款”三个意图节点。意图节点“取款”的下一级意图节点中，分别为“取款2万以下”、“取款2-5万”“取款5万以上”。意图节点“取款2万以下”的下级意图节点包括“银行卡取款2万以下”和“存折取款2万以下”。意图节点“取款5万以上”的下级意图节点包括“取款5万以上需预约”和“取款5万以上已预约”。

为了根据用户的输入信息确定用户的意图，本申请通过意图分类器及对应的数据处理来确定用户意图，具体过程如图3所示，为本申请人机交互方法中确定最佳意图的方法流程图，具体如下：

步骤S21、对意图分类器输入信息中的意图节点标签进行赋值。在本申请中，意图分类器输入信息为用户文本信息和意图节点标签的合并信息。其中，用户文本信息由步骤S1通过识别用户语音输入信息得到，此时已是已知量。而意图节点标签为一变量。系统数据库中存储有“当前意图节点”的信息，其中包括了当前意图节点标签，因而当前意图节点标签为一已知参量。在系统的最终初始使用时，当前意图节点可以为意图树中的任意一个节点，如最末级的一个意图节点。在使用过程中，系统保存了上一次交互完成后确定的当前意图节点人相关信息。根据所述当前意图节点在意图树节点群中的位置，可以确定从当前意图节点到根意图节点的节点分支。在本步骤中，通过访问数据库中“当前意图节点”信息，便可以得到当前意图节点标签，并将其赋值给意图分类器输入信息中的意图节点标签。

步骤S22、将所述的用户文本信息和当前意图节点标签合并为新的文本信息。

步骤S23、对所述新的文本信息进行分词处理。在该步骤中，采用现有技术中任意一种分词工具对所述新的文本信息进行分词。例如，针对文字信息“我想取一些钱，大概两万样子”，分词工具将其分为:我/想/取/一些/钱/，/大概/两万/样子。

步骤S24，将分词后的文本向量化，例如，通过在语料库中查询词向量，从而将文本转换为多个高维向量的组合。如前的例句，转化后的向量可以表示为：[V1,V2,V3,V4,V5,V6,V7,V8,V9]，其中V1-V9为例句中各个分词的对应词向量。

步骤S25、以所述词向量作为意图分类器的输入，得到一个预测意图。其中，所述意图分类器为一个意图分类模型，以文本向量为输入，意图节点标签为输出，通过输出的意图节点标签便可以确定是什么意图。通过对训练语料进行训练可以得到所述的意图分类模型。例如，采用公式y＝softmax(Wx+b)表示该模型，其中x为输入的文本向量，W与b为神经网络的权值，y为输出向量，其中最大值对应的标签即为得到的类别，也就是本申请所述的意图节点标签。也可以使用神经网络，如卷积神经网络(Convolutional Neural Network,简称CNN)或循环神经网络(Recurrent Neural Networks，简称RNN)等来获得对应的模型公式。

在得到预测意图后，需要确定所述的预测意图是否符合用户意图，因而需要验证所述的预测意图。验证方法有多种，以下为其中的一种：

步骤S26、根据所述预测意图，查找意图与预置输入信息的对照表，得到对应的预置输入信息。在本申请中，数据库中存储有意图与预置输入信息的对照表，其为预先设计、存储的问句或问题与其意图的对应表。通常，一个意图可对应多个问句。

步骤S27、分别计算用户文本信息与对应的预置输入信息的相似度，并获得最大相似度。由于两句话相似度越高，即越相似越可信，因而，通过计算两句话的相似度可以有效提高获得输出信息的精确性。

句子与句子间的相似度可以从多个维度来计算，包括语法、语义及句型。关于语法相似度(syntaxSim)，考虑词的顺序、句子的长度等；关于语义相似度(semanticSim)，通过各个词的词向量加权求平均的方式得出句子向量，并计算向量间的余弦值；句型相似度(classSim)，通过判断句子是否属于同一种句型，给0或1。

相似度计算的实施例一：

句子A与B的相似度可以采用以下公式计算：

sim(A,B)＝α*semanticSim(A,B)+β*syntaxSim(A,B)+γ*classSim(A,B)

其中α+β+γ＝1,α>β,γ

另外，也可以利用神经网络来计算，将句子向量化后，利用CNN、RNN或RNN+attention(注意力循环神经网络)，通过计算两句话的欧式距离或余弦夹角来训练相似度模型，从而得到两个句子的相似度。本实施例的计算简单，易解释。

相似度计算的实施例二：

将相同意图下的句子认为是相似句，将不同意图下的句子认为不相似，训练得到的模型即可计算两句话之间的相似度。

句子A与句子B的相似度可由以下用简单的公式表示：

sim(A,B)＝f(Wx1+b,Wx2+b)，X1、X2分别为句子A与句子B的向量，W、b为神经网络参数，f为通过欧式距离或余弦夹角计算相似度的函数。本实施例需要大量的语料来进行训练，因而准确度高。

相似度计算的实施例三：

将相同意图下句子与意图认为相似，将不同意图下句子与意图认为不相似，训练得到的模型即可计算句子与意图之间的相似度。

句子A与意图C的相似度可由以下用简单的公式表示：

sim(A,C)＝f(Wx1+b,Wx2+b)，X1、X2分别为句子A与意图C的向量，W、b为神经网络参数，f为通过欧式距离或余弦夹角计算相似度的函数。本实施例基于大量的语料训练，且计算速度快，可以有效提高系统的响应速度。

系统在初期可使用实施例一的方法计算相似度，在逐步积累大量语料后，过渡到实施例二或实施例三的方法，在设备性能足够的情况下，也可以同时使用三种相似度，最后综合考虑，采用投票机制或其它算法来决策最终的相似度。

步骤S28、判断当前意图节点是否为根节点，如果不是，执行步骤S29，如果是，执行步骤S30。

步骤S29、获取当前意图节点的上一级节点的意图节点标签。根据意图树及当前意图节点所在的位置，可以确定从所述当前意图节点开始，到根节点结束的节点分支。因而，在本步骤中，从该节点分支中获得当前意图节点的上一级节点的意图节点标签。

返回步骤S21，将当前意图节点的上一级节点的意图节点标签赋值给意图分类器输入信息中意图节点标签；重复执行步骤S21-27，得到又一个预测意图的最大相似度。而后，再由步骤S28判断是否结束循环处理过程，在所述根节点的意图节点标签得到预测意图及其最大相似度时，停止所述循环处理过程。通过前述的循环处理过程得到多个预测意图的最大相似度。

步骤S30、比较所述多个预测意图的最大相似度的分值，将分值最大的最大相似度确定为全局最大相似度。

步骤S31、判断所述全局最大相似度是否大于或等于第一阈值，如果所述最大相似度大于或等于第一阈值，说明此时的预测意图可以认定为就是用户的真实意图，因而在步骤S32确定所述最大相似度对应的预测意图符合用户意图，将其确定为最佳意图。

如果所述最大相似度小于所述第一阈值，说明在本系统中能够得到的与用户真实意图最接近的意图仍然不能代表用户的真实意图，说明此时用户输入的信息与本系统提供的服务不相符，在这种情况下，有两种处理办法，如图3所示，在步骤S33，将用户的所述用户文本信息和要求给予输出信息的交互请求发送给第三方系统。第三方系统接收到该交互请求和所述用户文本信息后进行相关处理，将得到的输出信息发送给本系统，本系统接收第三方系统返回的输出信息,并在步骤4输出所述输出信息。另外一种处理方式，即是在此种情况下输出特定的输出信息，例如“请重新输入”等信息。

在图3所示的方法中，在计算预测意图的最大相似度时，从系统存储的当前意图节点开始，到根节点结束的节点分支，逐级计算由每一个意图节点获取的预测意图的最大相似度。在计算完一个意图节点之后，判断是否当前计算的意图节点是否为根节点，如果是根节点，说明已经计算完根据节点分支上的所有意图节点而得到的预测意图的最大相似度，如果不是根节点，则继续取下一个意图节点来计算。本领域的技术人员可以得知，这种计算流程也可以有相应的变化，例如，获取预测意图的过程与计算预测意图的最大相似度的过程可以分开或并行完成。具体采用哪种方式，本领域的技术人员可以应系统要求及具体的软、硬件要求灵活采用前述的任一种方式。

在得到预测意图后，验证所述的预测意图是否符合用户意图的方法也可以采用另外一种，如图4所示，为本申请的确定最佳意图的另一种方法流程图。

图4所示方法的前几个步骤与图3中所述的方法相同，如：

步骤S21a、对意图分类器输入信息中的意图节点标签进行赋值，即将所述意图分类器输入信息中的意图节点标签设置为当前意图节点标签。

骤S22a、将所述的用户文本信息和当前意图节点标签合并为新的文本信息。

步骤S23a、对所述新的文本信息进行分词处理。

步骤S24a、将分词后的文本向量化。

步骤S25a、以所述词向量作为意图分类器的输入，得到一个预测意图。

步骤S26a、查找意图与预置输入信息的对照表，得到与所述预测意图对应的预置输入信息；

步骤S27a、计算用户文本信息与对应的预置输入信息的相似度，得到对应所述预测意图的最大相似度；

以下是与图3所示方法不同的步骤：

步骤S28a、判断所述预测意图的最大相似度是否大于或等于第二阈值，如果所述预测意图的最大相似度大于或等于第二阈值，在步骤S29a中则确定所述预测意图符合用户意图，将其设定为最佳意图。如果所述预测意图的最大相似度小于所述第二阈值，在步骤S30a中，判断用于意图分类器输入信息中的意图节点标签的节点是否为根节点，如果不是，执行步骤S31a。如果是根节点，执行步骤S32a。

步骤S31a、获取当前意图节点的上一级节点的意图节点标签。返回步骤S21a，将当前意图节点的上一级节点的意图节点标签赋值给意图分类器输入信息中意图节点标签，重复上述步骤。

步骤S32a、根据已计算得到的多个预测意图的最大相似度，从中得到分值最大的相似度，即全局最大相似度；

步骤S33a、判断所述全局最大相似度是否大于或等于第一阈值，如果大于或等于第一阈值，在步骤S34a,将所述全局最大相似度对应的预测意图确定为最佳意图；如果全局最大相似度小于所述第一阈值，在步骤S35a,向第三方发送请求或获取特定输出信息。

在本申请中，在获得了某一预测意图的最大相似度之后，通过与预置的第二阈值相比较，来判断所述预测意图是否符合用户意图。与图3所示的方法相比，不需要回溯意图树、获取全局最大相似度再判断是否符合用户意图，因而可以提高响应速度。

在本申请的系统数据库中，存储有相似度计算时使用的阈值这一数据，如果两个句子的相似度计算值达到了这个阈值，说明这两个句子是一样的，或者可以基本认为是同样的句子，此时，便可以确定当前预测意图即是用户输入该信息的真实意图，从而将当前的预测意图确定为最佳意图。当相似度的计算值小于所述阈值，说明两个句子的差别较大，用户输入该信息的意图与目前预测的意图不同。

在本申请实施例中设置了两个阈值，即第一阈值和第二阈值。对于一个较佳的实施例，第二阈值大于第一阈值，即系统不需回溯意图树，通过分值较大的第二阈值来确定是否已得到用户意图，从而加快处理速度，提高系统的响应速度。由于第二阈值较高分值的设置，提高了两句话相匹配的相关度，但是在当前最大相似度小于第二阈值时，不利于判断此时的两句话是否是同一话题，是否需要转到第三方系统。因而在全局最大相似度小于第二阈值时，需要与第一阈值比较，用于确定是否需要转到第三方系统。

关于第三方系统，第三方系统和本系统可以串行也可以并行，串行即本系统在未找到最佳意图时再请求第三方系统。并行即同时请求，本系统在执行确定最佳意图的步骤时，同时请求第三方系统，从而节省了时间。

使用者也可以根据实际需要和成本考量，不连接第三方系统，当本系统未找到最佳意图时，直接输出特定的信息，如“您的问题我还不知道怎么回答”、“请重新输入”等。

本申请的系统数据库中存储有意图与输出信息的对照表，因而，在步骤3中，根据步骤2中得到的最佳意图查询所述对照表，便可以确定输出信息，从而在步骤4中输出所述的输出信息。

关于对照表中的所述的输出信息，在一个较佳实施例中为文本信息。根据输出格式的需求，例如一些非机器人平台，具有显示界面等设备时，输出文本信息。也可以输出语音信息，即在输出前，将所述文本信息转成语音信息，例如通过tts转为语音信息后播放。

意图与输出信息的对照表可以为一一对应关系，也可以是一对多的对应关系，即一个意图可以对应多个输出信息，此时，可随机选取一个输出信息。

为了为前述的人机交互方法提供数据支持，本申请需要进行大量的语料训练。参照以下实施例具体说明语料训练的过程：

步骤S1b、收集输入问句及输出答案的对应信息。

步骤S2b、为每一对输入问句及输出答案的对应信息标注意图及对应的上级意图。经过步骤S1b和步骤S2b，得到如表1所示的数据。

表1：

步骤S3b、根据标注的意图及对应的上级意图生成意图树。例如，如图2所示的意图树。

步骤S4b、将每一个输入问句信息与意图节点标签合并为新的文本信息。

步骤S5b、以所述新的文本信息的词向量作为意图分类器的输入，所述意图分类器为前述方法中的意图分类模型，通过意图分类器得到一个预测意图。对应关系如下表2所示：

表2

意图+输入(问题)	预测意图
我需要取款	取款
取款一万	取款两万以下

取款两万以下银行卡

银行卡取款两万以下

经过上述语料训练方法，可以不断扩充语料，为本申请所述人机交互提供充分、丰富的语料内容。

本申请还提供了一种人机交互系统，其原理框图如图5所示。所述系统包括语音识别模块1、最佳意图确定模块2、查询模块3和输出模块4。其中，所述语音识别模块1接收用户输入的语音信息，并将用户的语音输入信息识别为对应的用户文本信息。所述最佳意图确定模块2与所述语音识别模块1和数据库相连接，数据库中储有意图树及意图节点标签，所述最佳意图确定模块2从所述数据库中取得意图节点标签，并根据所述语音识别模块1得到的用户文本信息，基于意图树的节点群，利用意图分类器确定最佳意图；在得到最佳意图后，将所述最佳意图发送给所述查询模块3。所述查询模块3根据所述最佳意图，在数据库中查询意图与输出信息的对照表，从而得到对应的输出信息，并将所述输出信息发送给所述的输出模块4。输出模块4得到所述输出信息后，根据设定格式或用户要求的格式输出所述输出信息，例如，以文字、语音等方式输出。

其中，所述最佳意图确定模块2的原理框图具体如图6所示，其包括合并单元21、意图分类器22、验证单元23和确定单元24。其中，所述合并单元21分别与语音识别模块1和数据库相连接，分别获得用户文本信息和意图节点标签，将所述的用户文本信息和意图节点标签合并为新的文本信息，并将该新的文本信息发送给意图分类器22。意图分类器22以所述合并单元的合并信息为输入信息，得到预测意图。所述验证单元23，用于验证所述预测意图是否符合用户意图。所述确定单元24用于将符合用户意图的预测意图确定为最佳意图。

其中，将所述验证单元包23括：查找子单元231、相似度计算子单元232和阈值比较子单元233。其中，查找子单元231所述用于根据意图分类器输出的预测意图，查找意图与预置输入信息的对照表，得到与预测意图对应的预置输入信息；所述相似度计算子单元232用于计算用户文本信息与对应的预置输入信息的相似度，获得对应预测意图的最大相似度。阈值比较子单元233用于比较所述最大相似度与阈值的大小，并将比较结果发送给所述确定单元。

根据不同的数据处理流程，上述各个单元、子单元结合成不同的结构，如图7所示，为最佳意图确定模块2实施例一的原理框图。

所述合并单元21a分别与语音识别模块1和数据库相连接，分别获得用户文本信息和当前意图节点标签，将所述的用户文本信息和当前意图节点标签合并为新的文本信息，并将该新的文本信息发送给意图分类器22a。所述合并单元还包括通知接收接口，用于接收合并通知，从而进行用户文本信息和新的意图节点标签的合并。

意图分类器22a以所述合并单元21a的合并信息为输入信息，得到预测意图。

根据意图分类器22a输出的预测意图，查找子单元231a查找意图与预置输入信息的对照表，得到与每一预测意图对应的预置输入信息。

所述相似度计算子单元232a计算用户文本信息与对应的预置输入信息的相似度，获得对应预测意图的最大相似度。所述相似度计算子单元232a包括通知输出接口，在计算完一个预测意图的最大相似度后，向所述合并单元21a发送合并通知。

所述合并单元21a通过通知接收接口接收合并通知，从而数据库中的意图树中取得当前意图节点的上一级节点的意图节点标签，进行新的合并，并把合并后的信息发送给意图分类器22a。

其中，也可以由意图分类器22a在得到一个预测意图后向所述合并单元21a发送合并通知，此时则不需要所述相似度计算子单元232a来发送合并通知。

经过多次循环计算，将意图树回溯到根节点后，停止回溯，所述相似度计算子单元232a从多个预测意图的最大相似度中得出分值最大的全局最大相似度，并将其发送给阈值比较单元233a。

阈值比较单元233a接收所述全局最大相似度，并从数据库中取得第一阈值，比较全局最大相似度和第一阈值的大小，如果全局最大相似度大于或等于第一阈值，则向确定单元24a发送通知，确定单元24a将与所述全局最大相似度对应的预测意图确定为最佳意图。如果全局最大相似度小于第一阈值，则通过第三方接口模块5向第三方系统6发送所述用户文本信息和交互请求。

第三方系统6根据所述交互请求和所述用户文本信息进行处理，并将处理后得到的回复信息(即应该回复用户的输出信息)发送给本系统。所述第三方接口模块5接收第三方系统6返回的输出信息，将所述输出信息发送给所述输出模块4，所述输出模块4输出该信息。

本申请提供第三方接口模块5与第三方系统6相连接，是为了解决向用户提供非本系统服务内容的回复。在实际应用中，用户输入的问句信息有时并不是本系统可以解决的内容，例如，在银行系统的交互系统中，用户问了其他领域的问题，如“燃气费用是多少”。在处理这类问题时，本系统在根据用户输入信息预测意图时，当预测意图已为意图树中的根意图、在计算相似度时，全局最大相似度仍然小于内部设定的第一阈值，此时，本系统可以判断此时用户输入的问句信息为本系统外的话题，所以将所述用户文本信息和交互请求发送给第三方系统，此时，由第三方系统处理所述问句信息，得到给用户的回复信息，第三方系统会将所述回复信息发送给本系统，由本系统的第三方接口模块5接收，并将所述回复信息发送给所述输出模块4，由所述输出模块4输出。因而，本系统不但可以就本系统领域的话题与用户进行交互，也可以在不同领域的话题之间切换，从而实现无话题障碍的交互，解答用户提出的各种问题。

如图8所示，为最佳意图确定模块2实施例二的原理框图。在本实施例中，其结构组成与最佳意图确定模块2实施例一相同，但是工作流程不同，具体如下：

所述合并单元21b分别获得用户文本信息和当前意图节点标签，将所述的用户文本信息和当前意图节点标签合并为新的文本信息，并将该新的文本信息发送给意图分类器22b。所述合并单元21b还包括通知接收接口，用于接收合并通知，从而进行新的合并。

意图分类器22b以所述合并单元21b的合并信息为输入信息，得到预测意图。

查找子单元231b所述用于根据意图分类器22b输出的预测意图，查找意图与预置输入信息的对照表，得到与所述预测意图对应的预置输入信息。

所述相似度计算子单元232b计算用户文本信息与对应的预置输入信息的相似度，获得对应预测意图的最大相似度,并将其发送给阈值比较单元233b。

阈值比较单元233b接收所述最大相似度，并从数据库中取得第二阈值，比较所述最大相似度和第二阈值的大小，如果最大相似度大于或等于第二阈值，则向确定单元24b发送通知，确定单元24b将与所述最大相似度对应的预测意图确定为最佳意图。如果所述最大相似度小于第二阈值，则通过通知接口向所述合并单元21b发送合并通知。

所述合并单元21b根据该接口接收的合并通知，从而数据库中的意图树中取得当前意图节点的上一级节点的意图节点标签，进行新的合并，并把合并后的信息发送给意图分类器22b。

意图分类器22b根据新的输入信息得到另一个预测意图。各部件的工作流程如上所述。直到当阈值比较单元233b通过比较得到根据根意图节点得到的预测意图的最大相似度也小于第二阈值时，向相似度计算单元232b发送通知，要求其提供全局最大相似度。相似度计算单元232b从所有的预测意图的最大相似度得到全局最大相似度，并将其发送给阈值比较单元233b。

阈值比较单元233b接收所述全局最大相似度，并从数据库中取得第一阈值，比较全局最大相似度和第一阈值的大小，如果全局最大相似度大于或等于第一阈值，则向确定单元24b发送通知，确定单元24b将与所述全局最大相似度对应的预测意图确定为最佳意图。如果全局最大相似度小于第一阈值时，则通过第三方接口模块5向第三方系统6发送所述用户文本信息和交互请求。

在以上实施例中，意图分类器22、22a、22b包括有文本向量化单元，用于将合并单元21、21a、21b发送的用户输入文本信息和意图节点标签的合并的新的文本信息进行分词和文本向量化处理，得到的词向量作为意图分类器22、22a、22b的输入。在另外的实施例中，最佳意图确定模块2包括所述的文本向量化单元，即与意图分类器22、22a、22b分开独立设置，便于模块化设计和维护。

为了计算的过程简便、信息读取迅速，本系统还包括当前意图节点维护模块7，如图9所示，用于在确定了最佳意图后，将最佳意图节点路径中路径长度最大的最佳意图节点设置为当前意图节点，则将最佳意图变更为当前意图，从而在系统下一次的交互过程开始时可以快速得到当前意图节点。在经过回溯意图树仍然没有得到最佳意图时，保留原来的当前意图节点不变。

在如图2所示意图树中，由于没有相同标签的意图节点，因而，当前意图节点维护模块7将最佳意图节点设置为当前意图节点。然而，有时意图对中会有多个相同标签的意图节点，如图10所示。此时，如果中有两个或多个相同的最佳意图节点标签，此时，需要将路径最长、最深的那个节点设定为当前意图节点。具体地，首先，在所述意图树的节点标签集中搜索所述最佳意图节点标签，得到对应最佳意图的节点路径；当对应最佳意图的节点路径为多个时，将路径长度最大的最佳意图节点确定为当前意图节点。

以下通过具体的应用实施例对本申请进行说明。

应用实施例一

结合图11所示的意图树及其回溯过程示意图，简要说明人机交互过程。在本实施例中，系统中的当前意图为“银行卡取款2万以下”，因而，从当前意图节点到根意图节点的节点分支中，按照从低到高(根意图节点处于最高级别)的级别，依次包括“银行卡取款2万以下”、“取款2万以下”、“取款”“Root”。当用户采用语音输入“我要贷款”时，获得输出信息的过程简要说明如下：

步骤S1、识别：系统将用户的语音输入“我要贷款”识别为文本信息。

步骤S2、合并1：“银行卡取款2万以下”+“我要贷款”。

步骤S3、文本向量化：分词，并向量化。

步骤S4、预测意图：采用意图分类器得到预测意图“采用银行卡取款2万以下”。

步骤S5、计算相似度，得到最大相似度得分：0.485366550785。

步骤S6、合并2：“取款2万以下”+“我要贷款”。

步骤S7、文本向量化：分词，并向量化。

步骤S8、预测意图：采用意图分类器得到预测意图“取款”。

步骤S9、计算相似度，得到最大相似度得分：0.577754257751。

步骤S10、合并3：“取款”+“我要贷款”。

步骤S11、文本向量化：分词，并向量化。

步骤S12、预测意图：采用意图分类器得到预测意图“取款”。

步骤S13、计算相似度，得到最大相似度得分：0.353053754796。

步骤S14、合并4：合并：“ROOT(空)”+“我要贷款”。

步骤S15、文本向量化：分词，并向量化。

步骤S16、预测意图：采用意图分类器得到预测意图“贷款”。

步骤S17、计算相似度，得到最大相似度得分：1.0。

步骤S18、从前述多个最大相似度中得到分值最大的全局最大相似度：1.0。

步骤S19、将所述全局最大相似度得分1.0与设定的第一阈值0.8进行比较，全局最大相似度大于所述第一阈值。

步骤S20、确定与所述全局最大相似度对应的预测意图“贷款”为最佳意图。

步骤S21、选取与“贷款”对应的输出信息“您要贷款多少”，并更新系统中的当前意图的节点为“贷款”。

步骤S22、向用户输出“您要贷款多少”的语音信息。

在本应用实施例中，通过回溯意图树，遍历了所述分支中的每一个节点，因而增加了最佳意图的准确性。

应用实施例二

在当前意图为“银行卡取款2万以下”，用户输入信息为“银行卡取款2万以下”时，其处理过程简要说明如下：

步骤S1、合并：“银行卡取款2万以下”+“银行卡取款2万以下”。

步骤S2、预测意图：“银行卡取款2万以下”。

步骤S3、计算最大相似度：1。

步骤S4、将所述最大相似度得分1.0与设定的第二阈值1.0进行比较，所述最大相似度等于所述第二阈值。

步骤S5、确定与所述最大相似度对应的预测意图“银行卡取款2万以下”为最佳意图。

步骤S6、选取与“银行卡取款2万以下”对应的输出信息“请您到自助取款机取款”，并更新系统中的当前意图的节点为“银行卡取款2万以下”。

步骤S7、向用户输出“请您到自助取款机取款”的语音信息。

在本实施例中，在找到了最大相似度大于第二阈值后便不再遍历意图树，从而节省了处理时间，提高了系统对用户的响应速度。

综上所述，本申请为用户意图明确、事务的完成有很清晰步骤的垂直领域，如银行、法院、医院等，提供了一种操作简单、系统处理快速、响应准确的人机交互方法和系统。本文采用意图树回溯机制，只需要标注垂直领域内语料的意图及上级意图，无需其它通用语料的标注，节省了大量的注标处理时间。在具体实现过程中，只需要用分类器预测意图，并采用回溯机制寻找最优的节点便可以得到准确的输出信息。能够实现业务内同一主题下交互和不同主题下的话题切换和交互，通过与第三方系统的通信，能够实现业务领域外话题的切换，为用户提供不同话题的回复信息。

本领域内的技术人员应明白，本发明的实施例可提供为方法、系统、或计算机程序产品。因此，本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

在一个典型的配置中，计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。内存可能包括计算机可读介质中的非永久性存储器，随机存取存储器(RAM)和/或非易失性内存等形式，如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。

计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括，但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带，磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质，可用于存储可以被计算设备访问的信息。按照本文中的界定，计算机可读介质不包括暂存电脑可读媒体(transitory media)，如调制的数据信号和载波。

还需要说明的是，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。

本领域技术人员应明白，本申请的实施例可提供为方法、系统或计算机程序产品。因此，本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且，本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

以上所述仅为本申请的实施例而已，并不用于限制本申请。对于本领域技术人员来说，本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等，均应包含在本申请的权利要求范围之内。

Claims

一种人机交互方法，其特征在于，包括：

将用户的语音输入信息识别为用户文本信息；

根据所述用户文本信息和意图节点标签，基于意图树节点群，通过意图分类器及对应的数据处理确定最佳意图；

根据所述最佳意图，查询意图与输出信息的对照表，得到对应的输出信息；和

输出所述输出信息。
如权利要求1所述人机交互方法，其特征在于，所述根据所述用户文本信息和意图节点标签，基于意图树节点群，通过意图分类器及对应的数据处理确定最佳意图的步骤具体包括：

获取当前意图节点标签；

从所述意图树节点群中确定从当前意图节点到根意图节点的节点分支；

将所述用户文本信息和意图节点标签合并为意图分类器的输入信息；

通过将意图分类器输入信息中的意图节点标签替换为所述节点分支中的意图节点标签，利用所述意图分类器得到对应的预测意图；和

验证所述预测意图是否符合用户意图，将符合用户意图的预测意图确定为最佳意图。
如权利要求2所述人机交互方法，其特征在于，其中，

将意图分类器输入信息中的意图节点标签替换为所述节点分支中的意图节点标签时，从当前意图节点开始，到根意图节点结束，分别用每一个节点的意图节点标签替换意图分类器输入信息中的意图节点标签，得到多个对应的预测意图；

验证所述预测意图是否符合用户意图的步骤包括：

查找意图与预置输入信息的对照表，得到与每一预测意图对应的预置输入信息；

计算用户文本信息与对应的预置输入信息的相似度，获得对应每一预测意图的最大相似度；

比较所述多个预测意图的最大相似度的分值大小，将分值最大的最大相似度确定为全局最大相似度；和

比较所述全局最大相似度和第一阈值的大小，如果所述全局最大相似度大于或等于所述第一阈值，则确定与所述全局最大相似度对应的预测意图符合用户意图。
如权利要求3所述人机交互方法，其特征在于，如果所述全局最大相似度小于所述第一阈值，或者：

获取对应的特定输出信息，并输出所述特定输出信息；

或者：

向第三方系统发送交互请求；接收第三方系统返回的第三方交互输出信息；和输出所述第三方交互输出信息。
如权利要求2所述人机交互方法，其特征在于，其中，

将意图分类器输入信息中意图节点标签替换为所述节点分支中的意图节点标签时，从当前意图节点开始，用当前意图节点标签替换意图分类器输入信息中的意图节点标签，得到对应的预测意图；

验证所述预测意图是否符合用户意图的步骤包括：

查找意图与预置输入信息的对照表，得到与所述预测意图对应的预置输入信息；

计算用户文本信息与对应的预置输入信息的相似度，得到对应所述预测意图的最大相似度；和

比较所述预测意图的最大相似度和第二阈值的大小，如果所述预测意图的最大相似度大于或等于第二阈值，则确定所述预测意图符合用户意图；如果所述预测意图的最大相似度小于所述第二阈值，将意图分类器输入信息中意图节点标签替换为所述节点分支中当前意图节点的上一级节点的意图节点标签，重复上述步骤。
如权利要求5所述人机交互方法，其特征在于，当将意图分类器输入信息中意图节点标签替换为根意图节点标签时得到的对应最大相似度小于所述第二阈值时，根据已计算得到的多个预测意图的最大相似度，比较所述多个预测意图的最大相似度的分值大小，将分值最大的最大相似度确定为全局最大相似度；和

比较所述全局最大相似度和第一阈值的大小，如果所述全局最大相似度大于或等于所述第一阈值，则确定与所述全局最大相似度对应的预测意图符合用户意图；

如果所述全局最大相似度小于所述第一阈值，或者：获取对应的特定输出信息；并输出所述特定输出信息；或者：向第三方系统发送交互请求；接收第三方系统返回的第三方交互输出信息；和向用户输出所述第三方交互输出信息。
如权利要求2所述人机交互方法，其特征在于，将符合用户意图的预测意图确定为最佳意图后，还包括：

将所述最佳意图对应的节点确定为当前意图节点。
如权利要求7所述人机交互方法，其特征在于，将所述最佳意图对应的节点确定为当前意图节点的步骤包括：

在所述意图树的节点标签集中搜索所述最佳意图节点标签，得到最佳意图节点路径；和

当最佳意图节点路径为多个时，将路径长度最大的最佳意图节点确定为当前意图节点。
如权利要求2-8任一所述人机交互方法，其特征在于，将所述用户文本信息和意图节点标签合并为意图分类器的输入信息的步骤具体包括：

将所述的用户文本信息和意图节点标签合并为新的文本信息；

对所述新的文本信息进行分词和文本向量化处理，得到对应的词向量；

将所述词向量作为意图分类器的输入信息。
如权利要求1-8任一所述人机交互方法，其特征在于，所述意图分类器为卷积神经网络模型或循环神经网络模型。
一种人机交互系统，包括：

语音识别模块，用于将用户的语音输入信息识别为用户文本信息，其特征在于，还包括：

最佳意图确定模块，用于根据所述用户文本信息和意图节点标签，基于意图树的节点群，通过意图分类器及对应的数据处理确定最佳意图；

查询模块，用于根据所述最佳意图，查询意图与输出信息的对照表，得到对应的输出信息；和

输出模块，用于输出所述输出信息。
如权利要求11所述人机交互系统，其特征在于，所述最佳意图确定模块包括：

合并单元，用于合并所述用户文本信息和意图节点标签；

意图分类器，用于以所述合并单元的合并信息为输入信息，得到预测意图；

验证单元，用于验证所述预测意图是否符合用户意图；和

确定单元，用于将符合用户意图的预测意图确定为最佳意图。
如权利要求12所述人机交互系统，其特征在于，所述验证单元包括：

查找子单元，用于根据意图分类器输出的预测意图，查找意图与预置输入信息的对照表，得到与每一预测意图对应的预置输入信息；

相似度计算子单元，用于计算用户文本信息与对应的预置输入信息的相似度，获得对应预测意图的最大相似度；和

阈值比较子单元，用于比较所述最大相似度与阈值的大小，并将比较结果发送给所述确定单元。
如权利要求13所述人机交互系统，其特征在于，所述合并单元包括通知接收接口，用于接收合并通知；

对应地，所述意图分类器包括通知输出接口，用于向所述合并单元发送合并通知；或者

所述相似度计算子单元包括通知输出接口，用于向所述合并单元发送合并通知；或者

所述阈值比较子单元包括通知输出接口，用于向所述合并单元发送合并通知。
如权利要求11-14任一所述人机交互系统，其特征在于，还包括当前意图节点维护模块，用于在最大相似度小于阈值时，保留当前意图节点；在确定了最佳意图时，将最佳意图节点路径中路径长度最大的最佳意图节点确定为当前意图节点。
如权利要求11-14任一所述人机交互系统，其特征在于，还包括：

第三方接口模块，与所述最佳意图确定模块相连接，用于在所述最佳意图确定模块确定没有最佳意图时，将所述用户文本信息和交互请求发送给第三方系统，并接收第三方系统返回的输出信息，将所述输出信息发送给所述输出模块。