CN110210036A

CN110210036A - 一种意图识别方法及装置

Info

Publication number: CN110210036A
Application number: CN201910483619.5A
Authority: CN
Inventors: 王珏; 张伟涛
Original assignee: Shanghai Yunshen Intelligent Technology Co Ltd
Current assignee: Shanghai Yunshen Intelligent Technology Co Ltd
Priority date: 2019-06-05
Filing date: 2019-06-05
Publication date: 2019-09-06

Abstract

本发明提供了一种意图识别方法及装置，包括：获取待意图识别信息；采用预先构建的意图信息抽取模型对所述待意图识别信息进行序列标注，得到意图关键词；判断所述待意图识别信息是否包含否定词；当所述待意图识别信息包含否定词时，根据所述意图关键词、以及其与所述否定词之间的关联关系，得到所述待意图识别信息的准确意图。本发明提供的意图识别方法，可以提升意图识别的准确性。

Description

一种意图识别方法及装置

技术领域

本发明涉及语义识别技术领域，尤指一种意图识别方法及装置。

背景技术

随着人工智能时代的来临，语音助手、智能陪护机器人等职能对话系统为人们生活带来了方便。对话系统主要由语音识别、语义理解、对话管理、答案生成、语音合成几个模块组成。意图识别作为语义理解的一部分，在整个对话过程中起着重要作用。

常见的意图识别方法有基于规则模板、基于统计特征分类等传统方法，还基于卷积神经网络、基于循环神经网络等深度学习方法。规则模板依赖数据，需要大量人力去编写相应的模板，随着数据增多，适应性太差；统计特征分类需要人为抽取特征，成本高，还不能得到用户隐含的意图，准确率也无法保障。基于卷积神经网络、循环神经网络等深度学习模型强依赖于训练样本的数据量和数据质量，在数据资源不足的情况下，很难对用户的意图充分建模，对于出现频率较低的话术，意图识别不可控。

比如，用户输入“我不想吃肯德基，我要吃川菜”，传统方法中如果没有对应的模板去解析，则很难识别出“肯德基”是否定意图；在类似这样既有否定意图、又有肯定意图的训练样本语料不足的情况下，深度学习模型很难学习到“肯德基”与“不想吃”之间的依存关系，所以现有技术往往会忽略“不想吃”这一需求，以为“肯德基”、“川菜”都是肯定意图，给用户返回包含肯德基和川菜的结果，比如向客户推荐吃肯德基的地方和吃川菜的地方。

发明内容

本发明的目的之一是为了克服现有技术中存在的至少部分不足，提供一种意图识别方法及装置，针对存在否定意图的语句，或既有肯定意图又有否定意图的复杂语句，提升意图识别的准确性。

本发明提供的技术方案如下：

一种意图识别方法，包括：获取待意图识别信息；采用预先构建的意图信息抽取模型对所述待意图识别信息进行序列标注，得到意图关键词；判断所述待意图识别信息是否包含否定词；当所述待意图识别信息包含否定词时，根据所述意图关键词、以及其与所述否定词之间的关联关系，得到所述待意图识别信息的准确意图。

进一步可选的，所述采用预先构建的意图信息抽取模型对所述待意图识别信息进行序列标注，得到意图关键词，之前包括：获取带有人工标注的意图关键词的语料样本；基于双向长短期记忆网络和条件随机场算法建立深度学习网络；用所述语料样本训练所述深度学习网络；当所述深度学习网络收敛时，得到意图信息抽取模型。

进一步可选的，所述采用所述意图信息抽取模型对所述待意图识别信息进行序列标注，得到意图关键词，包括：将所述待意图识别信息转换为符合高斯分布的语料向量；将所述语料向量分别输入双向长短期记忆网络中学习，得到每个字对应每种标签的概率；根据所述每个字对应每种标签的概率，再结合标签之间的依赖关系，经条件随机场算法得到概率最大的一组标签记录，作为序列标注的结果；根据所述序列标注的结果，得到意图关键词。

进一步可选的，所述判断所述待意图识别信息是否包含否定词包括：对序列标注后的待意图识别信息进行分词；遍历分词后的每个词语，判断是否至少存在一个词语在包含否定词的词库中能找到与其语义相同或相近的否定词；当至少存在一个词语在包含否定词的词库中能找到与其语义相同或相近的否定词时，则所述待意图识别信息包含否定词。

进一步可选的，所述根据所述意图关键词、以及其与所述否定词之间的关联关系，得到所述待意图识别信息的准确意图包括：根据文法规则模板，分析所述意图关键词与所述否定词之间的语义依存关系；根据所述意图关键词和所述语义依存关系得到所述待意图识别信息的准确意图。

进一步可选的，所述根据所述意图关键词和所述语义依存关系得到所述待意图识别信息的准确意图，包括：当所述意图关键词与所述否定词之间的语义依存关系为动宾关系时，则所述意图关键词具备否定意图；根据所述意图关键词的否定意图，得到所述待意图识别信息的准确意图。

进一步可选的，所述根据所述意图关键词和所述语义依存关系得到所述待意图识别信息的准确意图，还包括：当所述意图关键词与所述否定词之间的语义依存关系为独立或并列关系时，则所述否定词没有否定所述意图关键词；当所述待意图识别信息中不存在否定词否定所述意图关键词时，则所述意图关键词具备肯定意图；根据所述意图关键词的肯定意图，得到所述待意图识别信息的准确意图。

本发明还提供一种意图识别装置，包括：信息获取模块，用于获取待意图识别信息；意图信息抽取模块，用于采用预先构建的意图信息抽取模型对所述待意图识别信息进行序列标注，得到意图关键词；意图识别模块，用于判断所述待意图识别信息是否包含否定词；以及，当所述待意图识别信息包含否定词时，根据所述意图关键词、以及其与所述否定词之间的关联关系，得到所述待意图识别信息的准确意图。

进一步可选的，还包括：模型构建模块，用于获取带有人工标注的意图关键词的语料样本；基于双向长短期记忆网络和条件随机场算法建立深度学习网络；用所述语料样本训练所述深度学习网络；当所述深度学习网络收敛时，得到意图信息抽取模型。

进一步可选的，所述意图信息抽取模块包括：映射单元，用于将所述待意图识别信息转换为符合高斯分布的语料向量；序列标注单元，用于将所述语料向量按字分别输入双向长短期记忆网络中学习，得到每个字对应每种标签的概率；以及，根据所述每个字对应每种标签的概率，再结合标签之间的依赖关系，经条件随机场算法得到概率最大的一组标签记录，作为序列标注的结果；意图信息提取单元，用于根据所述序列标注的结果，得到意图关键词。

进一步可选的，所述意图识别模块包括：分词单元，用于对序列标注后的待意图识别信息进行分词；判断单元，用于遍历分词后的每个词语，判断是否至少存在一个词语在包含否定词的词库中能找到与其语义相同或相近的否定词；当至少存在一个词语在包含否定词的词库中能找到与其语义相同或相近的否定词时，则所述待意图识别信息包含否定词。

进一步可选的，所述意图识别模块还包括：意图分析单元，用于根据文法规则模板，分析所述意图关键词与所述否定词之间的语义依存关系；根据所述意图关键词和所述语义依存关系得到所述待意图识别信息的准确意图。

与现有技术相比，本发明的意图识别方法及装置的有益效果在于，针对存在否定意图的语句，或既有肯定意图又有否定意图的复杂语句，提升意图识别的准确性。

附图说明

下面将以明确易懂的方式，结合附图说明优选实施方式，对一种意图识别方法及装置的上述特性、技术特征、优点及其实现方式予以进一步说明。

图1是本发明的一种意图识别方法的一个实施例的流程图；

图2是本发明的一种意图识别方法的另一个实施例的流程图；

图3是图2中意图信息抽取模型提取意图关键词的一种流程图；

图4是图2中步骤S400和步骤S500的一种细化流程图；

图5是本发明的一种意图识别装置的一个实施例的结构示意图；

图6是本发明的一种意图识别装置的另一个实施例的结构示意图；

图7是意图信息抽取模型提取意图关键词的一种流程示意图。

附图标号说明：

100.信息获取模块，200.意图信息抽取模块，300.意图识别模块，400.模型构建模块，210.映射单元，220.序列标注单元，230.意图信息提取单元，310.分词单元，320.判断单元，330.意图分析单元。

具体实施方式

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对照附图说明本发明的具体实施方式。显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图，并获得其他的实施方式。

为使图面简洁，各图中只示意性地表示出了与本发明相关的部分，它们并不代表其作为产品的实际结构。另外，以使图面简洁便于理解，在有些图中具有相同结构或功能的部件，仅示意性地绘示了其中的一个，或仅标出了其中的一个。在本文中，“一个”不仅表示“仅此一个”，也可以表示“多于一个”的情形。

在本发明的一个实施例中，如图1所示，一种意图识别方法，包括：

步骤S200获取待意图识别信息。

具体的，待意图识别信息为待语义解析的文本信息，通俗的说，就是一条语句，待识别其意图。获取待意图识别信息的方式有多种。可选的，获取用户输入的文本信息。可选的，在语音助手、智能陪护机器人等智能对话系统中，还可采集用户发出的语音信息，对所述语音信息进行语音识别后获得的对应的文本信息，该文本信息即为待意图识别信息。可选的，针对配有摄像头的系统，还可通过摄像方式获取，比如，在摄像区域内获取图像，识别图像中的文本信息，即得到待意图识别信息。

步骤S300采用预先构建的意图信息抽取模型对所述待意图识别信息进行序列标注，得到意图关键词。

具体的，意图信息抽取模型的作用是对输入的文本信息(或语句)完成其意图关键词的抽取。意图关键词是指文本中反应其意图的关键词。比如，语句“我不吃肯德基”，其意图是“不吃肯德基”，关键词是“肯德基”。

上述从文本中提取关键词的问题可以转换为一个命名实体识别问题，所以可采用序列标注的方法。意图信息抽取模型是采用序列标注的方法从待意图识别信息中抽取出体现其意图的关键词。

序列标注方法，是采用标签的方式对一个序列(比如，语句)的每个字进行标注，有多种标注方式，从中选取发生概率最高的方式(即最优的方式)作为最后结果，根据该最后结果提取出所需要的信息。

比如，提取一条语句的意图关键词，使用3种标签(O、B-P、I-P)，O表示无关的字段，B-P表示所标记的意图关键词的开始字，I-P表示所标记的意图关键词的其余字。语句“我不吃肯德基”，有多种标注方式，假设第一种标注方式为O/O/O/B-P/I-P/I-P，第二种标注方式为O/O/O/B-P/I-P/O，第三种标注方式为O/B-P/I-P/O/O/O，……，第一种标注方式发生概率最高，所以选取该标注方式，根据该标注方式的结果，意图关键词为标签B-P、I-P所组成的词，即得到“肯德基”。

一条语句可能有多个意图关键词，比如，语句“我不吃肯德基，我要吃川菜”，有两个意图关键词，分别是“肯德基”和“川菜”，通过意图信息抽取模型能提取出上述两个意图关键词。

进一步的，意图信息抽取模型需要预先构建。可选的，采用卷积神经网络或循环神经网络构建深度学习网络，收集各种合适语料(比如，从互联网上)，并人工标注每条语料的意图关键词，这样得到训练样本，用这些样本训练该网络，当该网络收敛时(比如收敛准则为：针对95％以上的训练样本，模型输出的意图关键词与人工标注的相同)，即得到意图信息抽取模型。

步骤S400判断所述待意图识别信息是否包含否定词。

具体的，为了识别待意图识别信息的意图关键词是肯定意图，还是否定意图，需要先判断待意图识别信息中是否包含否定词。否定词表达了否定含义。可选的，对待意图识别信息进行分词，将分词后的每个词在否定词库中查找，若能找到，则表明待意图识别信息存在否定词，并确定该否定词在待意图识别信息中的位置；若不能找到，则待意图识别信息不存在否定词，从而表明待意图识别信息的意图关键词是肯定意图。

待意图识别信息中可能存在多个否定词，比如，语句“我不吃肯德基，也不吃川菜”，见下划线部分，在不同位置重复出现否定词“不吃”。

步骤S500当所述待意图识别信息包含否定词时，根据所述意图关键词、以及其与所述否定词之间的关联关系，得到所述待意图识别信息的准确意图。

具体的，分析待意图识别信息中的每个否定词与每个意图关键词之间的关系，如果否定词与意图关键词之间是动宾关系，则该关键词具备否定意图；如果否定词与意图关键词之间是独立或并列关系，则该否定词没有否定该意图关键词的意图。可选的，根据文法规则模板来分析否定词与意图关键词之间的语义依存关系。

默认意图关键词为肯定意图，如果不存在否定词否定该意图关键词，则该意图关键词为肯定意图；如果存在否定词否定该意图关键词，则该意图关键词为否定意图。当待意图识别信息中存在肯定意图的意图关键词时，则综合待意图识别信息中具备肯定意图的意图关键词，将其作为用户的准确意图。当待意图识别信息中不存在肯定意图的意图关键词时，则需要进一步了解用户的真实意图，比如，进一步对话。

比如，语句“我不吃肯德基，我要吃川菜”，有两个意图关键词，分别是“肯德基”和“川菜”，否定词是“不吃”。“不吃”与“肯德基”有动宾关系，这表明语句中的“肯德基”是否定意图；“我不吃肯德基”与“我要吃川菜”是独立结构，所以“不吃”与“川菜”是独立关系(或称为并列关系)，说明“不吃”没有否定“川菜”，又没有其他词语否定“川菜”，所以“川菜”是肯定意图。由此得到该语句的准确意图为“川菜”，向客户推荐吃川菜的地方。

比如，语句“我不吃肯德基，也不吃川菜”，有两个意图关键词，分别是“肯德基”和“川菜”，有两个否定词，分别是“肯德基”前面的“不吃”和“川菜”前面的“不吃”。“肯德基”前面的“不吃”与“肯德基”有动宾关系，这表明“肯德基”是否定意图；“川菜”前面的“不吃”与“川菜”有动宾关系，这表明“川菜”是否定意图。所以语句不存在肯定意图的意图关键词，需要进一步问用户以了解用户的真实意图，比如，“你想吃什么？”。

本实施例，为了解决深度学习模型识别否定意图欠佳的问题，在否定意图样本不足的情况下，先通过深度学习算法得到的意图信息抽取模型提取语句的意图关键词，再根据语句中的否定词与意图关键词的关系，识别否定意图，从而提升意图识别的准确性。

在本发明的另一个实施例中，如图2、图3、图4所示，一种意图识别方法，包括：

步骤S100获取带有人工标注的意图关键词的语料样本；

步骤S110基于双向长短期记忆网络和条件随机场算法建立深度学习网络；

步骤S120用所述语料样本训练所述深度学习网络；

步骤S130当所述深度学习网络收敛时，得到意图信息抽取模型。

具体的，可选的，从互联网上采用爬虫技术获取各种语料，从中挑选合适的语料，并人工标注每条语料的意图关键词，以得到模型训练用的语料样本。

采用BiLSTM(Bi-directional Long ShortTerm Memory，双向长短期记忆网络)和CRF(Conditional Random Field，条件随机场)算法建立深度学习网络。其中，BiLSTM用于对输入语句的每个字按预设标签进行标注，输出每个字对应每种标签的概率。BiLSTM由前向LSTM和后向LSTM构成，前向LSTM学习词语的前向依赖，后向LSTM学习词语的后向依赖，所以它比单向LSTM(是一种能实际应用的循环神经网络，可以学习长期依赖信息)能更好地捕获语句中每个字的上下文信息。CRF是从多种标注方式中选择最优路径(即概率最大的一组标签)作为序列标注的结果，从而得到输入语句的意图关键词。

用上述语料样本训练该网络，使之学习到每条语料与其人工标注的意图关键词之间的映射。当该网络收敛时(比如收敛准则为：针对每条训练样本，模型输出的意图关键词与人工标注的相同)，即得到意图信息抽取模型。

步骤S200获取待意图识别信息。

进一步，如图3所示，所述意图信息抽取模型从所述待意图识别信息提取意图关键词的步骤如下：

步骤S310将所述待意图识别信息转换为符合高斯分布的语料向量；

步骤S320将所述语料向量按字分别输入双向长短期记忆网络中学习，得到每个字对应每种标签的概率；

步骤S330根据所述每个字对应每种标签的概率，再结合标签之间的依赖关系，经条件随机场算法得到概率最大的一组标签记录，作为序列标注的结果；

步骤S340根据所述序列标注的结果，得到意图关键词。

具体的，首先需要对待意图识别信息的每个字数字化处理，鉴于高斯分布模型比较适合语义分析场景，所以将输入的待意图识别信息转换成符合高斯分布的语料向量。具体的，作为一种实施方式，将系统涉及的每个字按独热码(one-hot)编码方式处理，不同的字对应不同的独热码；将待意图识别信息的每个字用对应的独热码表达，然后将每个独热码映射为一个符合高斯分布(比如，均值为0、方差为0.1的高斯分布)的n维向量，不同的独热码对应不同的n维向量，如此得到的所有的n维向量构成了一个向量矩阵，即该待意图识别信息对应的语料向量。由于独热码只有其中1位比特为1，所以根据独热码中1的位置就可以快速映射到一个n维向量，计算机系统处理比较方便。由于独热码将两个字之间的关联关系完全割裂，所以需要将独热码转换为高斯分布的向量。比如，词语“肯德基”中的三个字之间是有一定依赖关系的，如果每个字用独热码表达，则把这种依赖关系完全舍弃了，这会影响系统后续意图关键字的提取；而采用高斯分布的n维向量来表达，则保留了这种依赖关系，且认为“肯德基”一起出现的频度符合高斯分布，这有利于提高意图关键字提取的准确度。此处只是使用独热码来索引n维向量，也可以采用其他方式来索引n维向量。

将得到的语料向量按字分别输入BiLSTM中，得到每个字对应每种标签的概率，如图7所示(仅作为一种示例)，有3种标签(O、B-P、I-P)，O表示无关的字段，B-P表示所标记的意图关键词的开始字，I-P表示所标记的意图关键词的其余字，“我”字输入一个BiLSTM，分别得到O的概率为1.5，B-P的概率为0.03，I-P的概率为0.01，表明“我”字为O的概率较高；“德”字输入另一个BiLSTM，分别得到O的概率为0.12，B-P的概率为0.1，I-P的概率为0.12，表明“德”字为O或I-P的概率较高。假设根据BiLSTM的输出，选择每个字对应概率最大的标签作为最优标注方式，如图7所示，结果是O/B-P/O/I-P/I-P/O，或者O/B-P/O/I-P/O/O，与正确结果有差异。CRF考虑了标签之间的依赖关系，从BiLSTM层的输出中选择概率最大的一组标签作为序列标注的结果，延续上述图7示例，增加“I-P之前必须是B-P、O之后可以为O或B-P”等标签之间的依赖关系，直接剔除O/B-P/O/I-P/I-P/O、O/B-P/O/I-P/O/O，选择概率最大的一组标签O/O/O/B-P/I-P/I-P，作为序列标注的结果。结合标签之间的依赖关系，提高了序列标注的准确度。

步骤S400判断所述待意图识别信息是否包含否定词。

进一步，如图4所示，可采用如下步骤判断所述待意图识别信息是否包含否定词：

步骤S410对序列标注后的待意图识别信息进行分词；

步骤S420遍历分词后的每个词语，判断是否至少存在一个词语在包含否定词的词库中能找到与其语义相同或相近的否定词；

步骤S430当至少存在一个词语在包含否定词的词库中能找到与其语义相同或相近的否定词时，则所述待意图识别信息包含否定词；

步骤S440当不存在词语在包含否定词的词库中能找到与其语义相同或相近的否定词时，则所述待意图识别信息不包含否定词。

具体的，对序列标注后的待意图识别信息进行分词，比如，对语句“我不吃肯德基”分词，序列标注中，“肯德基”要作为一个词，所以得到分词结果“我/不吃/肯德基”。将分词后得到的每个词语到词库中去查找，比如，分词“我”，在词库中能找到语义相同的词语“我”，但该词语不是否定词，所以分词“我”不是否定词。又比如，分词“不吃”，在词库中能找到语义相同的词语“不吃”，该词语是否定词，所以分词结果“不吃”是否定词。

比如，对语句“我不想吃肯德基”分词，得到分词结果“我/不想吃/肯德基”，其中，分词“不想吃”，在词库中能找到语义相近(语义相似度大于阈值)的词语“不吃”，该词语是否定词，所以分词结果“不想吃”是否定词。

当分词后的词语中存在至少一个否定词时，则待意图识别信息包含否定词，并得到该否定词在语句中的位置。

当分词后的词语中不存在否定词时，则待意图识别信息不包含否定词，根据意图关键词就可以得到待意图识别信息的准确意图。

步骤S500当所述待意图识别信息包含否定词时，根据所述意图关键词、以及其与所述否定词之间的语义依存关系，得到所述待意图识别信息的准确意图。

进一步，如图4所示，分析的意图关键词与否定词之间的语义依存关系，可采用如下步骤：

步骤S510根据文法规则模板，分析所述意图关键词与所述否定词之间的语义依存关系；

步骤S520根据所述意图关键词和所述语义依存关系得到所述待意图识别信息的准确意图。

具体的，比如，语句“我不吃肯德基”，能匹配到文法规则模板“PO ADVNNN”(PO表示人称、ADVN表示否定动词、NN表示名词，其中ADVN与NN之间是动宾关系)，所以否定词“不吃”与意图关键词“肯德基”之间是动宾关系，这进一步表明上述语句的“肯德基”是否定意图。由于语句中不再存在其他意图关键词，只有否定意图的“肯德基”，为了进一步了解用户的真实意图，需要再问用户，比如，“你想吃什么？”。

又比如，语句“我不吃肯德基，我要吃川菜”，有两个意图关键词，分别是“肯德基”和“川菜”，否定词是“不吃”。该语句可以用文法规则模板1“PO ADVN NN”和文法规则模板2“PO VV NN”(VV表示非否定含义的动词)匹配，模板1匹配前者，模板2匹配后者。根据否定词“不吃”与意图关键词“肯德基”之间的动宾关系，得出“肯德基”具备否定意图。根据非否定词“要吃”与意图关键词“川菜”之间的动宾关系，得出“川菜”具备肯定意图。综合这两种意图，选择肯定意图作为用户的真实意图，所以得到该语句的准确意图为“川菜”，向客户推荐吃川菜的地方。

又比如，语句“我喝不甜的咖啡”，有一个意图关键词“咖啡”，有一个否定词“不甜的”。该语句可以用文法规则模板3“PO VVADJ NN”(VV表示非否定含义的动词，ADJ表示形容词)匹配。由文法规则模板3可知，ADJ是修饰NN，所以否定词“不甜的”是修饰意图关键词“咖啡”，否定词与意图关键词之间是修饰关系，“不甜的”否定了“咖啡”的部分属性。“喝”与“咖啡”之间是动宾关系，“喝”没有否定的含义，所以“咖啡”具备肯定意图。但由于存在否定词修饰意图关键词，限定了意图关键词的部分属性，所以得到用户的真实意图为“不甜的咖啡”。

本实施例采用BiLSTM和CRF算法构建意图信息抽取模型，BiLSTM与CRF的结合算法相对单纯的BiLSTM，能够提高意图关键词的抽取的准确率。利用文法规则模板识别语句中的否定词与意图关键词的关系，识别否定意图，从而提升意图识别的准确性。

在本发明的一个实施例中，如图5所示，一种意图识别装置，包括：

信息获取模块100，用于获取待意图识别信息。

意图信息抽取模块200，用于采用预先构建的意图信息抽取模型对所述待意图识别信息进行序列标注，得到意图关键词。

意图识别模块300，用于判断所述待意图识别信息是否包含否定词；以及，当所述待意图识别信息包含否定词时，根据所述意图关键词、以及其与所述否定词之间的关联关系，得到所述待意图识别信息的准确意图。

分析待意图识别信息中的每个否定词与每个意图关键词之间的关系，如果否定词与意图关键词之间是动宾关系，则该关键词具备否定意图；如果否定词与意图关键词之间是独立或并列关系，则该否定词没有否定该意图关键词的意图。可选的，根据文法规则模板来分析否定词与意图关键词之间的语义依存关系。

在本发明的另一个实施例中，如图6所示，一种意图识别装置，包括：

模型构建模块400，用于获取带有人工标注的意图关键词的语料样本；基于双向长短期记忆网络和条件随机场算法建立深度学习网络；用所述语料样本训练所述深度学习网络；当所述深度学习网络收敛时，得到意图信息抽取模型。

信息获取模块100，用于获取待意图识别信息。

所述意图信息抽取模块包括：

映射单元210，用于将所述待意图识别信息转换为符合高斯分布的语料向量；

序列标注单元220，用于将所述语料向量按字分别输入双向长短期记忆网络中学习，得到每个字对应每种标签的概率；以及，根据所述每个字对应每种标签的概率，再结合标签之间的依赖关系，经条件随机场算法得到概率最大的一组标签记录，作为序列标注的结果；

意图信息提取单元230，用于根据所述序列标注的结果，得到意图关键词。

所述意图识别模块300包括：

分词单元310，用于对序列标注后的待意图识别信息进行分词；

判断单元320，用于遍历分词后的每个词语，判断是否至少存在一个词语在包含否定词的词库中能找到与其语义相同或相近的否定词；当至少存在一个词语在包含否定词的词库中能找到与其语义相同或相近的否定词时，则所述待意图识别信息包含否定词；否则，所述待意图识别信息不包含否定词。

当分词后的词语中存在至少一个否定词时，则待意图识别信息包含否定词，并得到该否定词在语句中的位置。当分词后的词语中不存在否定词时，则待意图识别信息不包含否定词，根据意图关键词就可以得到待意图识别信息的准确意图。

意图分析单元330，用于根据文法规则模板，分析所述意图关键词与所述否定词之间的语义依存关系；根据所述意图关键词和所述语义依存关系得到所述待意图识别信息的准确意图。

具体的，比如，语句“我不吃肯德基”，能匹配到文法规则模板“PO ADVNNN”(PO表示人称、ADVN表示否定动词、NN表示名词，其中ADVN与NN之间是动宾关系)，所以否定词“不吃”与意图关键词“肯德基”之间是动宾关系，这进一步表明上述语句的“肯德基”是否定意图。由于语句中不再存在其他意图关键词，即不存在肯定意图的关键词，只有否定意图的“肯德基”，为了进一步了解用户的真实意图，需要再问用户，比如，“你想吃什么？”。

应当说明的是，上述实施例均可根据需要自由组合。以上所述仅是本发明的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视为本发明的保护范围。

Claims

1.一种意图识别方法，其特征在于，包括：

获取待意图识别信息；

采用预先构建的意图信息抽取模型对所述待意图识别信息进行序列标注，得到意图关键词；

判断所述待意图识别信息是否包含否定词；

当所述待意图识别信息包含否定词时，根据所述意图关键词、以及其与所述否定词之间的关联关系，得到所述待意图识别信息的准确意图。

2.根据权利要求1所述的意图识别方法，其特征在于，所述采用预先构建的意图信息抽取模型对所述待意图识别信息进行序列标注，得到意图关键词，之前包括：

获取带有人工标注的意图关键词的语料样本；

基于双向长短期记忆网络和条件随机场算法建立深度学习网络；

用所述语料样本训练所述深度学习网络；

当所述深度学习网络收敛时，得到意图信息抽取模型。

3.根据权利要求1所述的意图识别方法，其特征在于，所述采用所述意图信息抽取模型对所述待意图识别信息进行序列标注，得到意图关键词，包括：

将所述待意图识别信息转换为符合高斯分布的语料向量；

将所述语料向量分别输入双向长短期记忆网络中学习，得到每个字对应每种标签的概率；

根据所述每个字对应每种标签的概率，再结合标签之间的依赖关系，经条件随机场算法得到概率最大的一组标签记录，作为序列标注的结果；

根据所述序列标注的结果，得到意图关键词。

4.根据权利要求3所述的意图识别方法，其特征在于，所述判断所述待意图识别信息是否包含否定词包括：

对序列标注后的待意图识别信息进行分词；

遍历分词后的每个词语，判断是否至少存在一个词语在包含否定词的词库中能找到与其语义相同或相近的否定词；

当至少存在一个词语在包含否定词的词库中能找到与其语义相同或相近的否定词时，则所述待意图识别信息包含否定词。

5.根据权利要求4所述的意图识别方法，其特征在于，所述根据所述意图关键词、以及其与所述否定词之间的关联关系，得到所述待意图识别信息的准确意图包括：

根据文法规则模板，分析所述意图关键词与所述否定词之间的语义依存关系；

根据所述意图关键词和所述语义依存关系得到所述待意图识别信息的准确意图。

6.根据权利要求5所述的意图识别方法，其特征在于，所述根据所述意图关键词和所述语义依存关系得到所述待意图识别信息的准确意图，包括：

当所述意图关键词与所述否定词之间的语义依存关系为动宾关系时，则所述意图关键词具备否定意图；

根据所述意图关键词的否定意图，得到所述待意图识别信息的准确意图。

7.根据权利要求6所述的意图识别方法，其特征在于，所述根据所述意图关键词和所述语义依存关系得到所述待意图识别信息的准确意图，还包括：

当所述意图关键词与所述否定词之间的语义依存关系为独立或并列关系时，则所述否定词没有否定所述意图关键词；

当所述待意图识别信息中不存在否定词否定所述意图关键词时，则所述意图关键词具备肯定意图；

根据所述意图关键词的肯定意图，得到所述待意图识别信息的准确意图。

8.一种意图识别装置，其特征在于，包括：

信息获取模块，用于获取待意图识别信息；

意图信息抽取模块，用于采用预先构建的意图信息抽取模型对所述待意图识别信息进行序列标注，得到意图关键词；

意图识别模块，用于判断所述待意图识别信息是否包含否定词；以及，当所述待意图识别信息包含否定词时，根据所述意图关键词、以及其与所述否定词之间的关联关系，得到所述待意图识别信息的准确意图。

9.根据权利要求8所述的意图识别装置，其特征在于，还包括：

模型构建模块，用于获取带有人工标注的意图关键词的语料样本；基于双向长短期记忆网络和条件随机场算法建立深度学习网络；用所述语料样本训练所述深度学习网络；当所述深度学习网络收敛时，得到意图信息抽取模型。

10.根据权利要求8所述的意图识别装置，其特征在于，所述意图信息抽取模块包括：

映射单元，用于将所述待意图识别信息转换为符合高斯分布的语料向量；

序列标注单元，用于将所述语料向量按字分别输入双向长短期记忆网络中学习，得到每个字对应每种标签的概率；以及，根据所述每个字对应每种标签的概率，再结合标签之间的依赖关系，经条件随机场算法得到概率最大的一组标签记录，作为序列标注的结果；

意图信息提取单元，用于根据所述序列标注的结果，得到意图关键词。

11.根据权利要求10所述的意图识别装置，其特征在于，所述意图识别模块包括：

分词单元，用于对序列标注后的待意图识别信息进行分词；

判断单元，用于遍历分词后的每个词语，判断是否至少存在一个词语在包含否定词的词库中能找到与其语义相同或相近的否定词；当至少存在一个词语在包含否定词的词库中能找到与其语义相同或相近的否定词时，则所述待意图识别信息包含否定词。

12.根据权利要求11所述的意图识别装置，其特征在于，所述意图识别模块还包括：

意图分析单元，用于根据文法规则模板，分析所述意图关键词与所述否定词之间的语义依存关系；根据所述意图关键词和所述语义依存关系得到所述待意图识别信息的准确意图。