CN109543190B

CN109543190B - 一种意图识别方法、装置、设备及存储介质

Info

Publication number: CN109543190B
Application number: CN201811447021.2A
Authority: CN
Inventors: 孟振南; 胡晓慧
Original assignee: Beijing Yufanzhi Information Technology Co ltd
Current assignee: Beijing Yufanzhi Information Technology Co ltd
Priority date: 2018-11-29
Filing date: 2018-11-29
Publication date: 2023-06-16
Anticipated expiration: 2038-11-29
Also published as: CN109543190A

Abstract

本发明实施例公开了一种意图识别方法、装置、设备及存储介质，其中，该方法包括：获取用户指令文本；对所述用户指令文本进行同义词扩展，得到扩展词集；对所述用户指令文本进行规则匹配，得到匹配的目标规则；将所述扩展词集以及所述目标规则输入到预先训练的意图模型，得到意图预测结果。本发明实施例提供的技术方案可以对意图的特征进行补充和丰富，可以提高意图识别的准确率，可以对特殊文本或者少数样本进行预测，可以提高特殊或者少数样本预测的正确率。

Description

一种意图识别方法、装置、设备及存储介质

技术领域

本发明实施例涉及意图识别技术，特别是涉及一种意图识别方法方法、装置、设备及系统。

背景技术

近年随着语音识别、人机对话、自然语言处理等技术迅猛发展。用户意图识别是对这一类助手型对话产品来说极为重要，且又极具挑战的一项任务。用户意图识别是从用户的输入中理解用户的需求，例如：用户1：明天的天气如何？意图1：查询天气；用户2：明天上午10:00有个会，请在9:50的时候提醒我一下，多谢！意图2：设置闹钟。

发明人在具体实施意图识别的过程中，发现现有技术中存在如下问题：传统的意图识别方法可以是基于规则进行匹配，从而预测用户意图，但是使用场景局限；或者意图识别可以从概率的角度出发，通过训练得到统计模型，但是统计模型对少数本文的描述能力较差，从而导致意图预测准确性较低，或者现有的一些其他的预测方法，在实际应用场景中，对一些特殊样本需要单独处理，从而影响预测效率。

发明内容

本发明实施例提供了一种意图识别方法、装置、设备及存储介质，可以对意图的特征进行补充和丰富，可以提高意图识别的准确率，可以对特殊文本或者少数样本进行预测，可以提高特殊或者少数样本预测的正确率。

为了解决上述问题，本发明实施例主要提供如下技术方案：

第一方面，本发明实施例提供了一种意图识别方法，包括：

获取用户指令文本；

对所述用户指令文本进行同义词扩展，得到扩展词集；

对所述用户指令文本进行规则匹配，得到匹配的目标规则；

将所述扩展词集以及所述目标规则输入到预先训练的意图模型，得到意图预测结果。

第二方面，本发明实施例还提供一种意图识别装置，包括：

获取模块，用于获取用户指令文本；

扩展模块，用于对所述用户指令文本进行同义词扩展，得到扩展词集；

规则匹配模块，用于对所述用户指令文本进行规则匹配，得到匹配的目标规则；

预测模块，用于将所述扩展词集以及所述目标规则输入到预先训练的意图模型，得到意图预测结果

第三方面，本发明实施例还提供一种电子设备，包括：

至少一个处理器；

以及与所述处理器连接的至少一个存储器、总线；其中，

所述处理器、存储器通过所述总线完成相互间的通信；

所述处理器用于调用所述存储器中的程序指令，以执行本发明实施例提供的一种意图识别方法。

第四方面，本发明实施例还提供了一种非暂态计算机可读存储介质，所述非暂态计算机可读存储介质存储计算机指令，所述计算机指令使所述计算机执行本发明实施例提供的一种意图识别方法。

借由上述技术方案，本发明实施例提供的技术方案至少具有下列优点：

本发明实施例提供的技术方案，通过对用户指令文本进行同义词扩展，得到扩展词集，并对用户指令文本进行规则匹配，得到匹配的目标规则，将扩展词集和目标规则作为预先训练的意图模型的特征，得到意图预测结果，可以对意图的特征进行补充和丰富，可以提高意图识别的准确率，尤其可以提高特殊或者少数样本预测的正确率。

上述说明仅是本发明实施例技术方案的概述，为了能够更清楚了解本发明实施例的技术手段，而可依照说明书的内容予以实施，并且为了让本发明实施例的上述和其它目的、特征和优点能够更明显易懂，以下特举本发明实施例的具体实施方式。

附图说明

通过阅读下文优选实施方式的详细描述，各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的，而并不认为是对本发明实施例的限制。而且在整个附图中，用相同的参考符号表示相同的部件。在附图中：

图1a是本发明实施例提供的一种意图识别方法流程图；

图1b是本发明实施例提供的一种意图识别架构图；

图2是本发明实施例提供的一种意图识别方法流程图；

图3是本发明实施例提供的一种意图识别装置结构框图；

图4是本发明实施例提供的一种电子设备结构示意图。

具体实施方式

下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例，然而应当理解，可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反，提供这些实施例是为了能够更透彻地理解本公开，并且能够将本公开的范围完整的传达给本领域的技术人员。

图1a是本发明实施例提供的一种意图识别方法流程图，所述方法由意图识别装置来执行，所述装置由软件和/或硬件来执行，所述装置可以配置在智能手机、平板电脑等设备中。所述方法可以应用于人机对话的场景中。

如图1a所示，本发明实施例提供的技术方案包括：

S110：获取用户指令文本。

在本发明实施例中，可以直接获取用户输入的文本，即用户指令文本，用户通过文本形式与设备进行对话。或者也可以是获取用户输入的语音会话，将语音会话转换成文本，从而可以实现用户通过语音进行人机互动。

S120：对所述用户指令文本进行同义词扩展，得到扩展词集。

在本发明实施例中，同义词是指意义相同或者相近的词。其中，扩展词集中包括扩展的词以及用户指令文本中的词。

举例说明，例如，用户的指令文本是查询天气，其中，扩展到的查询的同义词可以是查找、搜索。天气的同义词可以是气象。则得到的扩展词集中包括：查找、搜索、气象、查询和天气。

S130：对所述用户指令文本进行规则匹配，得到匹配的目标规则。

在本发明实施例中，对所述用户指令文本进行规则匹配可以具体是将用户指令文本与预设的规则进行规则匹配，得到匹配的目标规则。

在本发明实施例中，可以对用户指令文本基于有限状态机的匹配方法进行规则匹配。其中，通过有限状态机的匹配方法进行规则匹配，可以提高匹配效率。

在本发明实施例的一个实施方式中，可选的，在对所述用户指令文本进行规则匹配，得到匹配的目标规则之前，还可以包括：设置正则表达式，作为预设的规则；其中，所述预设的规则中包括对固定句型和/或者设定样本设置的正则表达式；设定样本包括各种方言样本、或者包含知识库中未出现实体的样本，或者出现频率低于设定值的样本。其中，预设的规则的数量为多个，其中，每个规则可以是不相同，每个规则包括匹配条件。有的规则中包括对固定句型和/或设定样本的匹配条件。其中，当用户指令文本与规则中的匹配条件匹配时，可以确定该规则为与用户指令文本匹配的规则，即目标规则。其中，匹配条件可以是对固定句型设置的匹配条件，和/或对设定样本设定的匹配条件，或者还可以是其他设定条件。

由此，通过对规则中的固定句型和/或者设定样本设置的正则表达式，可以适配一些比较特殊的文本，保证数量较少或者句型特殊的文本在意图识别时的正确率。

S140：将所述扩展词集以及所述目标规则输入到预先训练的意图模型，得到意图预测结果。

在本发明实施例中，所述意图模型包括最大熵模型、支持向量机模型、XGBoost模型、或者卷积神经网络模型，或者也可以是其他机器学习模型。其中，用户指令文本的扩展词集以及与用户指令文本匹配的目标规则可以作为意图模型的特征，输入到预先训练的意图模型中，得到意图预测结果。

其中，支持向量机(Support Vector Machine，SVM)，是机器学习领域中一种常见的判别方法，它是一个有监督的学习模型，通常用来进行模式识别、分类以及回归分析。

在本发明实施例中，目标规则的数量可以是一个，也可以是多个。当目标规则是多个时，当输入到预先训练的意图模型，预先训练的意图模型可以对多个目标规则进行优先级排序，从而确定优先级最高的目标规则。当扩展词集输入到预先训练的意图模型时，预先训练的意图模型可以对扩展词集中的词进行优先级排序，根据优先级确定各个词的权重，根据各个词的权重确定不同意义的词进行组合的权重，选取权重最大的组合，并根据该组合以及优先级最高的目标规则，得到意图预测结果。

其中，通过机器学习模型得到意图预测结果，可以适应不同类型的文本，可以覆盖大多数的使用场景，或者覆盖大多数的语言现象。

本发明实施例提供的技术方案的架构如图1b所示，通过对用户指令文本进行同义词扩展和规则匹配，从而将扩展词集和匹配到的规则作为意图模型的特征，即为特征转换，通过意图模型进行意图预测，得到用户意图

现有技术中，自然语言处理(Natural Language Processing，NLP)中基于规则的意图识别方法，主要是从句型和语法规则的角度对文本进行分析，定义一些正则表达式作为规则，从而利用规则对文本进行匹配，该方法对于有着相同句型语法的样本具有较好的效果，但是规则的使用场景局限，无法覆盖所有的自然语言现象，同时无法对词的多义性进行描述。

现有的基于统计的意图识别方法则是从从概率角度出发，通过样本中词的出现顺序和次数等统计信息来计算概率，从而训练得到统计模型。基于统计模型得到用户意图，统计模型的泛化能力较强，适用范围更广，但是基于概率的模型对于少数文本的描述能力较差。

现有的自然语言理解(Natural Language Understanding，NLU)工具和平台多数集成了各种统计模型，从算法角度来说效果都已经很好，但是在实际应用场景中，需要对一些特殊样本进行单独处理，现有的工具都无法兼顾。

本发明实施例提供的技术方案，通过将同义词扩展得到的扩展词集和匹配的目标规则作为意图模型的输入特征，得到意图预测结果，可以对意图的特征进行补充和丰富，可以覆盖更多的语言现象，可以覆盖大多数的使用场景，可以提高意图识别的准确率，可以对特殊文本或者少数样本进行预测，可以提高特殊文本或者预测的正确率。

本发明实施例提供的一种意图识别方法，通过对用户指令文本进行同义词扩展，得到扩展词集，并对用户指令文本进行规则匹配，得到匹配的目标规则，将扩展词集和目标规则作为预先训练的意图模型的特征，得到意图预测结果，可以对意图的特征进行补充和丰富，可以提高意图识别的准确率，尤其可以提高特殊或者少数样本预测的正确率。

图2是本发明实施例提供的一种意图识别方法流程图，在本发明实施例中，可选的，所述对所述用户指令文本进行同义词扩展，得到扩展词集，可以包括：

对所述用户指令文本中的关键字进行同义词扩展；

在扩展到的同义词中筛选出历史出现次数超过设定次数的词；

将筛选出的词与所述关键字，组成扩展词集。

以及，可选的，所述对所述用户指令文本进行规则匹配，得到匹配的目标规则，可以包括：

对所述用户指令文本基于有限状态机的匹配方法进行规则匹配，得到匹配的目标规则。

如图2所示，本发明实施例提供的技术方案包括：

S210：获取用户指令文本。

S220：对所述用户指令文本中的关键字进行同义词扩展。

其中，关键字可以解析用户指令文本，并根据解析结果进行确定。其中，可以分析用户指令文本中的句型，从而确定关键字，或者也可以采用其他的方法确定用户指令文本中的关键字，对关键字的确定方法，本发明实施例并不作限定。

例如，用户指令文本是：明天的天气如何，则用户指令文本中的关键字可以是：明天和天气。

由此，通过对用户指令文本中的关键字进行同义词扩展，可以减小没有意义的词语的利用，提高意图预测的效率。

S230：在扩展到的同义词中筛选出历史出现次数超过设定次数的词。

在本发明实施例中，设定次数可以根据需要进行确定，例如，可以是10次，或者20次等。

可选的，当扩展到的同义词的数量超过设定数量时，可以在扩展的同义词中筛选出历史出现次数超过设定次数的词，当扩展到的同义词的数量超过设定数量时，也可以不进行筛选。其中，历史出现次数是指在历史指令文本中的出现次数。

例如，同义词“查找”在历史指令文本中出现的次数是10次，则“查找”的历史出现次数为10次。

S240：将筛选出的词与所述关键字，组成扩展词集。

在本发明实施例中，将筛选出的词与用户指令文本中的关键字，组成扩展词集。由此，通过将扩展的同义词进行扩展，将在扩展的同义词中进行筛选，将筛选得到的词与用户指令文本中的关键字组成扩展词集，可以减少意图模型输出结果的时间，可以提高预测效率。

S250：对所述用户指令文本基于有限状态机的匹配方法进行规则匹配，得到匹配的目标规则。

在本发明实施例中，有限状态机(finite-state machine，FSM)又称有限状态自动机，简称状态机，是表示有限个状态以及在这些状态之间的转移和动作等行为的数学模型。当通过有限状态机的匹配方法进行规则匹配时，匹配时，可以将是否匹配上的条件通过状态进行表示，从而可以避免规则匹配时的重复匹配问题，从而提高规则匹配的效率。

S260：将所述扩展词集以及所述目标规则输入到预先训练的意图模型，得到意图预测结果。

在上述实施例的基础上，本发明实施例提供的意图识别方法还可以包括：获取多个训练样本；其中，训练样本中包含至少两个同义词；

确定与所述训练样本匹配的规则以及意图结果样本；以所述训练样本、匹配的规则为意图模型的输入，以所述意图结果样本为意图模型的输出，对所述意图模型进行训练，得到预先训练的意图模型。通过以所述训练样本、匹配的规则为意图模型的输入，以所述意图结果样本对意图模型进行训练，可以提高模型的泛化能力，以提高意图模型对不同类型的文本的适应能力。

图3是本发明实施例提供的一种意图识别装置结构框图，如图3所示，本发明实施例提供的装置，包括：获取模块310、扩展模块320、规则匹配模块330和预测模型340。

其中，获取模块310，用于获取用户指令文本；

扩展模块320，用于对所述用户指令文本进行同义词扩展，得到扩展词集；

规则匹配模块330，用于对所述用户指令文本进行规则匹配，得到匹配的目标规则；

预测模块340，用于将所述扩展词集以及所述目标规则输入到预先训练的意图模型，得到意图预测结果。

可选的，扩展模块320，用于对所述用户指令文本中的关键字进行同义词扩展；

将筛选出的词与所述关键字，组成扩展词集。

可选的，规则匹配模块330，用于对所述用户指令文本基于有限状态机的匹配方法进行规则匹配，得到匹配的目标规则。

可选的，所述装置还可以包括训练模型，用于：

获取多个训练样本；其中，训练样本中包含至少两个同义词；

确定与所述训练样本匹配的规则以及意图结果样本；

以所述训练样本、匹配的规则为意图模型的输入，以所述意图结果样本为意图模型的输出，对所述意图模型进行训练，得到预先训练的意图模型。

所述装置还可以包括：规则设置模块，用于设置正则表达式，作为预设的规则；

其中，所述预设的规则中包括对固定句型和/或设定样本设置的正则表达式；设定样本包括各种方言样本、或者包含知识库中未出现实体的样本，或者出现频率低于设定值的样本。

可选的，所述意图模型包括最大熵模型、支持向量机模型、XGBoost模型、或者卷积神经网络模型。

可选的，所述目标规则的数量为至少一个。

由于本实施例所介绍的意图识别装置为可以执行本发明实施例中的意图识别方法的装置，故而基于本发明实施例中所介绍的意图识别方法，本领域所属技术人员能够了解本实施例的意图识别装置的具体实施方式以及其各种变化形式，所以在此对于该意图识别装置如何实现本发明实施例中的多意图识别方法不再详细介绍。只要本领域所属技术人员实施本发明实施例中意图识别方法所采用的装置，都属于本申请所欲保护的范围。

本发明实施例提供了一种电子设备，如图4所示，包括：至少一个处理器(processor)41；以及与所述处理器41连接的至少一个存储器(memory)42、总线43；其中，

所述处理器41、存储器42通过所述总线43完成相互间的通信；

所述处理器41用于调用所述存储器42中的程序指令，以执行上述方法实施例中的步骤，即：

获取用户指令文本；

对所述用户指令文本进行同义词扩展，得到扩展词集；

对所述用户指令文本进行规则匹配，得到匹配的目标规则；

本实施例提供一种非暂态计算机可读存储介质，所述非暂态计算机可读存储介质存储计算机指令，所述计算机指令使所述计算机执行上述各方法实施例所提供的方法。

获取用户指令文本；

对所述用户指令文本进行同义词扩展，得到扩展词集；

对所述用户指令文本进行规则匹配，得到匹配的目标规则；

本领域内的技术人员应明白，本申请的实施例可提供为方法、系统、或计算机程序产品。因此，本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

在一个典型的配置中，计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。

存储器可能包括计算机可读介质中的非永久性存储器，随机存取存储器(RAM)和/或非易失性内存等形式，如只读存储器(ROM)或闪存(flash RAM)。存储器是计算机可读介质的示例。

计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括，但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带，磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质，可用于存储可以被计算设备访问的信息。按照本文中的界定，计算机可读介质不包括暂存电脑可读媒体(transitory media)，如调制的数据信号和载波。

还需要说明的是，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。

本领域技术人员应明白，本申请的实施例可提供为方法、系统或计算机程序产品。因此，本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且，本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

以上仅为本申请的实施例而已，并不用于限制本申请。对于本领域技术人员来说，本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等，均应包含在本申请的权利要求范围之内。

Claims

1.一种意图识别方法，其特征在于，包括：

获取用户指令文本；

对所述用户指令文本进行同义词扩展，得到扩展词集；

对所述用户指令文本进行规则匹配，得到匹配的目标规则；

将所述扩展词集以及所述目标规则输入到预先训练的意图模型，得到意图预测结果；

所述对所述用户指令文本进行同义词扩展，得到扩展词集，包括：

对所述用户指令文本中的关键字进行同义词扩展；

将筛选出的词与所述关键字，组成扩展词集；

设置正则表达式，作为预设的规则；

2.根据权利要求1所述的方法，其特征在于，所述对所述用户指令文本进行规则匹配，得到匹配的目标规则，包括：

3.根据权利要求1所述的方法，其特征在于，还包括：

确定与所述训练样本匹配的规则以及意图结果样本；

4.根据权利要求2所述的方法，其特征在于，所述意图模型包括最大熵模型、支持向量机模型、XGBoost模型、或者卷积神经网络模型。

5.根据权利要求1所述的方法，其特征在于，所述目标规则的数量为至少一个。

6.一种意图识别装置，其特征在于，包括：

获取模块，用于获取用户指令文本；

预测模块，用于将所述扩展词集以及所述目标规则输入到预先训练的意图模型，得到意图预测结果；

所述扩展模块，用于对所述用户指令文本中的关键字进行同义词扩展；

将筛选出的词与所述关键字，组成扩展词集；

规则设置模块，用于设置正则表达式，作为预设的规则；

7.一种电子设备，其特征在于，包括：

至少一个处理器；

以及与所述处理器连接的至少一个存储器、总线；其中，

所述处理器、存储器通过所述总线完成相互间的通信；

所述处理器用于调用所述存储器中的程序指令，以执行权利要求1-5中任一项所述的一种意图识别方法。

8.一种非暂态计算机可读存储介质，其特征在于，所述非暂态计算机可读存储介质存储计算机指令，所述计算机指令使所述计算机执行权利要求1-5中任一项所述的一种意图识别方法。