CN114661910A

CN114661910A - 一种意图识别方法、装置、电子设备及存储介质

Info

Publication number: CN114661910A
Application number: CN202210307597.9A
Authority: CN
Inventors: 董益华
Original assignee: Ping An Technology Shenzhen Co Ltd
Current assignee: Ping An Technology Shenzhen Co Ltd
Priority date: 2022-03-25
Filing date: 2022-03-25
Publication date: 2022-06-24
Also published as: WO2023178965A1

Abstract

本发明实施例公开了一种意图识别方法、装置、电子设备及存储介质，意图识别方法包括：根据原始意图样本数据获取第一目标意图样本数据；其中，第一目标意图样本数据包括非长尾输入样本数据和意图匹配结果排序数据；对非长尾输入样本数据进行实体抽象，得到抽象泛化实体词；对抽象泛化实体词和所述意图匹配结果排序数据进行逻辑组合，以生成意图匹配泛化字典；根据意图匹配泛化字典构建第一意图识别模型；在确定待识别输入数据为非长尾输入数据的情况下，将待识别输入数据输入至第一意图识别模型中；根据第一意图识别模型输出待识别输入数据的意图识别结果。本发明实施例的技术方案能够提高意图理解的准确率。

Description

一种意图识别方法、装置、电子设备及存储介质

技术领域

本发明实施例涉及信息处理等人工智能技术领域，尤其涉及一种意图识别方法、装置、电子设备及存储介质。

背景技术

意图识别也可以称为意图检测(Intent Detection)，其用于确定输入的信息用于执行哪一个领域的哪一种操作，其本质属于多元分类问题，广泛应用于搜索及人机交互等智能化交互技术。智能化交互的一种体现在于，智能化产品或应用可以通过意图识别的方式理解需求，并依据需求为提供适当的响应。

意图识别的重要环节就是处理query(查询请求)。每一个query都隐藏着真实的查询意图，在理解query时，需要使用很多不同策略挖掘背后的需求。因此，如何正确识别query意图，分析感兴趣的内容，并在有限的资源位中展示最感兴趣的内容，对提升智能化交互功能的体验具有重要意义。

发明人在实现本发明的过程中，发现现有技术存在如下缺陷：目前，现有的意图识别方法在处理query时，基本采用一刀切的原则，并没有对query区分长尾query和非长尾query两种不同类型query的处理方式。长尾query的集中度低，但是累计数量接近无穷。虽然单个长尾query搜索量不多，但是具有长尾效应，总的搜索量与头部的非长尾query量可以相媲美。如果不区分长尾query和非长尾query两种不同类型query的处理方式，采用统一的处理方式理解query，会导致意图理解准确率较低。

发明内容

本发明实施例提供一种意图识别方法、装置、电子设备及存储介质，能够提高意图理解的准确率。

根据本发明的一方面，提供了一种意图识别方法，包括：

根据原始意图样本数据获取第一目标意图样本数据；其中，所述第一目标意图样本数据包括非长尾输入样本数据和意图匹配结果排序数据；

对所述非长尾输入样本数据进行实体抽象，得到抽象泛化实体词；

对所述抽象泛化实体词和所述意图匹配结果排序数据进行逻辑组合，以生成意图匹配泛化字典；

根据所述意图匹配泛化字典构建第一意图识别模型；

在确定待识别输入数据为非长尾输入数据的情况下，将所述待识别输入数据输入至所述第一意图识别模型中；

根据所述第一意图识别模型输出所述待识别输入数据的意图识别结果。

根据本发明的另一方面，提供了一种意图识别装置，包括：

第一样本数据获取模块，用于根据原始意图样本数据获取第一目标意图样本数据；其中，所述第一目标意图样本数据包括非长尾输入样本数据和意图匹配结果排序数据；

抽象泛化实体词获取模块，用于对所述非长尾输入样本数据进行实体抽象，得到抽象泛化实体词；

意图匹配泛化字典生成模块，用于对所述抽象泛化实体词和所述意图匹配结果排序数据进行逻辑组合，以生成意图匹配泛化字典；

第一意图识别模型构建模块，用于根据所述意图匹配泛化字典构建第一意图识别模型；

待识别输入数据输入模块，用于在确定待识别输入数据为非长尾输入数据的情况下，将所述待识别输入数据输入至所述第一意图识别模型中；

意图识别结果输出模块，用于根据所述第一意图识别模型输出所述待识别输入数据的意图识别结果。

根据本发明的另一方面，提供了一种电子设备，所述电子设备包括：

至少一个处理器；以及

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的计算机程序，所述计算机程序被所述至少一个处理器执行，以使所述至少一个处理器能够执行本发明任一实施例所述的意图识别方法。

根据本发明的另一方面，提供了一种计算机可读存储介质，所述计算机可读存储介质存储有计算机指令，所述计算机指令用于使处理器执行时实现本发明任一实施例所述的意图识别方法。

本发明实施例通过根据原始意图样本数据获取包括非长尾输入样本数据和意图匹配结果排序数据的第一目标意图样本数据后，对非长尾输入样本数据进行实体抽象，得到抽象泛化实体词，并对抽象泛化实体词和意图匹配结果排序数据进行逻辑组合，以生成意图匹配泛化字典，从而根据意图匹配泛化字典构建第一意图识别模型，以利用第一意图识别模型对输入数据结果为非长尾输入数据的待识别输入数据输进行意图识别，输出待识别输入数据的意图识别结果，解决现有意图识别方法存在的意图理解准确率较低的问题，能够提高意图理解的准确率。

应当理解，本部分所描述的内容并非旨在标识本发明的实施例的关键或重要特征，也不用于限制本发明的范围。本发明的其它特征将通过以下的说明书而变得容易理解。

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明实施例一提供的一种意图识别方法的流程图；

图2是本发明实施例二提供的一种意图识别方法的流程图；

图3是本发明实施例二提供的一种BERT模型训练过程的示意图；

图4是本发明实施例四提供的一种意图识别装置的示意图；

图5示出了可以用来实施本发明的实施例的电子设备的结构示意图。

具体实施方式

为了使本技术领域的人员更好地理解本发明方案，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分的实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都应当属于本发明保护的范围。

需要说明的是，本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

本发明实施例可以基于人工智能技术对相关的数据进行获取和处理。其中，人工智能(Artificial Intelligence，AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能，感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。

人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、机器人技术、生物识别技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。

实施例一

图1是本发明实施例一提供的一种意图识别方法的流程图，本实施例可适用于根据非长尾输入样本数据构建意图识别模型以对非长尾输入数据进行意图识别的情况，该方法可以由意图识别装置来执行，该装置可以由软件和/或硬件的方式来实现，并一般可集成在电子设备中，该电子设备可以是终端设备，也可以是服务器设备，本发明实施例并不对电子设备的具体设备类型进行限定。

相应的，如图1所示，该方法包括如下操作：

S110、根据原始意图样本数据获取第一目标意图样本数据；其中，所述第一目标意图样本数据包括非长尾输入样本数据和意图匹配结果排序数据。

其中，第一目标意图样本数据可以是用于构建第一意图识别模型的样本数据。原始意图样本数据可以是全量的历史意图数据。可选的，意图数据可以是用户意图数据，如用户query数据，也可以是设备或程序自动生成的意图数据，如，设备发出的数据搜索指令或模拟真实用户发出query数据等，本发明实施例并不对意图数据的数据类型以及生成方式进行限定。输入样本数据也即需要意图理解的样本数据，例如可以是用户输入的query数据，也可以是设备或程序等输入的query数据等。输入样本数据可以是文本类型的数据，也可以是语音类型的数据，本发明实施例并不对用户输入样本数据的数据类型进行限制。可以理解的是，长尾数据指的是非目标数据但与目标数据相关的，也可以带来搜索流量的组合型数据。非长尾数据则指的是目标数据。非长尾输入样本数据可以是非长尾形式的输入样本数据，也即，非长尾输入样本数据可以直接作为关键词或直接切分得到多个关键词后进行意图理解。意图匹配结果排序数据可以是对非长尾用户输入样本数据进行意图理解后得到的反馈数据的排序结果。

在本发明实施例中，意图可以是任意类型的意图，如可以包括但不限于搜索意图和交互意图等。具有意图的对象如用户、设备或程序后，可以简称为意图输出对象。

示例性的，在智能搜索技术领域，意图可以是搜索意图。当意图输出对象需要在网络或应用中搜索相关内容时，针对意图输出对象提供的搜索语句，可以基于搜索语句来识别意图输出对象的搜索意图，以便根据意图输出对象的搜索意图来为意图输出对象推荐相关内容。相应的，非长尾输入样本数据即可以为意图输出对象的非长尾的搜索语句，意图匹配结果排序数据可以是意图输出对象根据反馈的意图识别结果的操作排序数据。在一个具体的例子中，假设非长尾输入样本数据为APP的功能模块搜索数据，则意图匹配结果排序数据可以是用户对APP针对功能模块搜索数据反馈的功能模块的点击频次的排序数据。

示例性的，在智能交互技术领域，意图可以是对话意图或交互意图。例如在智能问答系统中，可以根据意图输出对象输入的句子(可以是文本类型，也可以是语音类型等)识别意图输出对象的意图，并为意图输出对象提供合适的回应。相应的，非长尾输入样本数据即可以为意图输出对象的对话语句，意图匹配结果排序数据可以是意图输出对象根据反馈的意图识别结果的操作排序数据。在一个具体的例子中，假设非长尾输入样本数据为用户对智能问答系统输入的对话语音数据，则意图匹配结果排序数据可以是用户对智能问答系统针对对话语音数据反馈的响应语音结果的认可度的排序数据。

S120、对所述非长尾输入样本数据进行实体抽象，得到抽象泛化实体词。

其中，抽象泛化实体词可以是对非长尾输入样本数据抽象得到的实体词构建的泛化数据结构。

在得到第一目标意图样本数据中的非长尾输入样本数据之后，可以对非长尾输入样本数据进行实体抽象。所谓实体抽象也即从非长尾输入样本数据中抽取出实体词，以根据抽取的实体词构建抽象泛化实体词。

在一个具体的例子中，以电商APP为例说明，当用户输入的非长尾输入样本数据为“原生木浆卫生纸”时，根据该非长尾输入样本数据可以得到的抽象泛化实体词为“原生木浆#商品#”。

S130、对所述抽象泛化实体词和所述意图匹配结果排序数据进行逻辑组合，以生成意图匹配泛化字典。

其中，意图匹配泛化字典可以对非长尾输入样本数据提供意图匹配结果排序数据，以确定非长尾输入样本数据最终的意图理解结果。也即，意图匹配泛化字典可以是用于对非长尾输入样本数据查找意图理解结果的结构化字典。

相应的，在根据非长尾输入样本数据得到对应的抽象泛化实体词之后，即可根据非长尾输入样本数据对应的抽象泛化实体词和意图匹配结果排序数据，对每个非长尾输入样本数据构建匹配的字典查询单元，进而根据各非长尾输入样本数据构建匹配的字典查询单元构建意图匹配泛化字典。

在本发明实施例中，意图匹配泛化字典可以利用对非长尾输入样本数据进行实体抽象得到抽象泛化实体词作为基准匹配单元，将同一非长尾输入样本数据的意图匹配结果排序数据作为基准匹配单元的备选意图理解结果，从而将同一非长尾输入样本数据的基准匹配单元和各备选意图理解结果组合为该非长尾输入样本数据的在意图匹配泛化字典中的字典查询单元。

在一个具体的例子中，假设某一医疗APP的非长尾输入样本数据为“晚上睡觉脚抽筋是怎么回事”，针对该非长尾输入样本数据得到的抽象泛化实体词可以为“晚上睡觉#身体部位##疾病#是怎么回事”，该非长尾输入样本数据的意图匹配结果排序数据为：“功能模块01”:30；“功能模块02”:20；“功能模块03”:10。其中，每个功能模块后续的字段数值可以为用户历史点击该功能模块的次数。例如，针对“功能模块01”:30，表示各个用户在医疗APP中输入“晚上睡觉脚抽筋是怎么回事”的搜索query时，用户对医疗APP反馈的各个功能模块的搜索结果中，对功能模块01点击了30次。可以理解的是，历史点击次数越多，表明该功能模块与用户搜索意图越匹配。相应的，对上述抽象泛化实体词和意图匹配结果排序数据进行逻辑组合，可以得到非长尾输入样本数据为“晚上睡觉脚抽筋是怎么回事”对应的字典查询单元，其数据结构如下：

“晚上睡觉#身体部位##疾病#是怎么回事”:

{“功能模块01”:30

“功能模块02”:20

“功能模块03”:10}

可以理解的是，意图匹配泛化字典可以根据领域设置，如一个技术领域对应构建一个意图匹配泛化字典。或者，意图匹配泛化字典还可以同时涉及多个领域，本发明实施例对此并不进行限制。

S140、根据所述意图匹配泛化字典构建第一意图识别模型。

其中，所述第一意图识别模型用于识别非长尾输入数据的意图。

在本发明实施例中，根据意图匹配泛化字典构建第一意图识别模型，可以是直接将意图匹配泛化字典作为第一意图识别模型，用于对非长尾输入数据进行意图识别，得到最终的意图理解结果。

S150、在确定待识别输入数据为非长尾输入数据的情况下，将所述待识别输入数据输入至所述第一意图识别模型中。

S160、根据所述第一意图识别模型输出所述待识别输入数据的意图识别结果。

相应的，如果确定待识别输入数据是非长尾输入数据，则可以将待识别输入数据输入至构建的第一意图识别模型中，以通过第一意图识别模型识别非长尾的待识别输入数据。

由此可见，通过针对非长尾输入样本数据和其匹配的意图匹配结果排序数据构建得到的意图匹配泛化字典作为第一意图识别模型，可以通过第一意图识别模型对非长尾的输入数据进行意图识别，从而提高对非长尾的输入数据的意图理解的准确率。

实施例二

图2是本发明实施例二提供的一种意图识别方法的流程图，本实施例以上述实施例为基础进行具体化，在本实施例中，给出了根据原始意图样本数据获取第一目标意图样本数据、对所述非长尾输入样本数据进行实体抽象、根据所述意图匹配泛化字典构建第一意图识别模型以及构建第二意图识别模型和目标意图识别模型的多种具体可选的实现方式。相应的，如图2所示，本实施例的方法可以包括：

S210、根据非长尾输入数据筛选规则从所述原始意图样本数据中筛选所述非长尾输入样本数据。

其中，非长尾输入数据筛选规则也即用于筛选非长尾的输入数据的规则。

可选的，非长尾输入数据筛选规则可以用于限定数据中关键词的数量，也即，当原始意图样本数据中的关键词数量大于一定阈值时，该数据为长尾输入样本数据；当原始意图样本数据中的关键词数量小于或等于一定阈值时，该数据为非长尾输入样本数据。用于划分长尾输入数据和非长尾输入数据的阈值可以根据实际需求设定，如20等，本发明实施例并不对该阈值的具体取值进行限定。

S220、获取所述非长尾输入样本数据的关联意图反馈数据。

其中，关联意图反馈数据可以是对非长尾输入样本数据反馈的数据，以及反馈的数据的相关统计数据等。

S230、对所述关联意图反馈数据进行排序，得到所述意图匹配结果排序数据。

当从原始意图样本数据中筛选得到非长尾输入样本数据之后，可以进一步获取非长尾输入样本数据的关联意图反馈数据，并对获取的关联意图反馈数据进行排序，得到意图匹配结果排序数据。可选的，对关联意图反馈数据进行排序时，可以是按照降序的顺序进行排序。

在一个具体的例子中，假设关联意图反馈数据为应用功能模块的点击频次数据，则可以按照点击频次由高到低的顺序对应用功能模块的点击频次数据进行排序，得到意图匹配结果排序数据。假设关联意图反馈数据为智能交互系统对意图输出对象输入数据的响应交互数据，如人机对话中query的机器交互频次数据等，则可以按照交互频次由高到低的顺序对响应交互数据进行排序，得到意图匹配结果排序数据。可以理解的是，点击频次或机器交互频次越高，表明意图输出对象对意图识别结果的认可度越高。

在一个具体的例子中，假设非长尾输入样本数据为“晚上睡觉脚抽筋是怎么回事”，在历史数据中，APP对该非长尾输入样本数据可以反馈3个匹配的功能模块作为关联意图反馈数据，分别为功能模块01、功能模块02和功能模块03，其中，功能模块01被历史点击的次数为30，功能模块02被历史点击的次数为20，功能模块03被历史点击的次数为10，则对关联意图反馈数据进行排序，得到意图匹配结果排序数据可以为：“功能模块01”:30；“功能模块02”:20；“功能模块03”:10。

S240、根据实体词字典对所述非长尾输入样本数据进行实体抽象，得到初始抽象实体词。

其中，实体词字典可以是由实体词构成的字典。初始抽象实体词可以是对非长尾输入样本数据抽象得到的各个实体词。

S250、对所述初始抽象实体词进行分类分组，得到所述抽象泛化实体词。

在本发明实施例中，可以首先根据实体词字典对非长尾输入样本数据进行实体抽象，将组成非长尾输入样本数据的各个实体词作为初始抽象实体词，进一步对抽象得到的初始抽象实体词进行分类分组，得到抽象泛化实体词。

在一个具体的例子中，以医疗APP为例说明，实体词字典例如可以包括但不限于疾病、症状、科室、商品以及身体部位等实体词。假设输入样本数据为“原生木浆卫生纸”，则该输入样本数据可以抽象为“原生木浆#商品#”，假设输入样本数据为“葡萄糖酸锌口服溶液”，则该输入样本数据可以抽象为“药品##身体部位#服溶液”。进一步的，还需要对抽象后的初始抽象实体词进行归类分组，例如：“药品##身体部位#服溶液”的初始抽象实体词可以分类为“#药品#|#身体部位#”。也即“#药品#|#身体部位#”为一种类型的抽象泛化实体词，可以用于匹配“葡萄糖酸锌口服溶液”以及“艾草生姜足贴”等类型的输入样本数据。

S260、对所述抽象泛化实体词和所述意图匹配结果排序数据进行逻辑组合，以生成意图匹配泛化字典。

在一个具体的例子中，以用户query样本数据中包括身体部位和疾病实体词为例说明，假设当前有三个用户query样本数据分别为：“晚上睡觉脚抽筋是怎么回事”、“12指肠糜烂吃什么药好”、“后背一天有两阵发热怎么回事吃啥药缓解”，基于这三个用户query样本数据可以构建的意图匹配泛化字典如下：

上述意图匹配泛化字典的数据结果对同时具有身体部位和疾病实体的query具有极强的泛化性。

上述意图匹配泛化字典可以基于DFA(Deterministic Finite Automaton，即确定有穷自动机)算法对非长尾的输入数据进行意图识别。

S270、根据所述意图匹配泛化字典的字典元素构建输入数据编辑距离计算模块。

其中，字典元素也即意图匹配泛化字典的字典查询单元。示例性的，意图匹配泛化字典的字典元素例如可以是“晚上睡觉#身体部位##疾病#是怎么回事”以及“#身体部位#一天有两阵#疾病#怎么回事吃啥药缓解”等。输入数据编辑距离计算模块可以用于计算输入数据与字典元素之间的编辑距离。可以理解的是，编辑距离越小，表明输入数据与字典元素越相近，也即输入数据与字典元素越匹配。

可以理解的是，字典元素可以作为查询匹配基准，对输入数据进行匹配。示例性的，基于用户历史行为构建的字典元素可以为：“晚上睡觉#身体部位##疾病#是怎么回事”。当输入的非长尾数据为“晚上睡觉脚抽筋怎么了”或者“夜间睡觉脚抽筋是怎么回事”都可以认为是字典元素“晚上睡觉#身体部位##疾病#是怎么回事”的泛化。也即，“晚上睡觉脚抽筋怎么了”或者“夜间睡觉脚抽筋是怎么回事”在意图匹配泛化字典所匹配到的字典元素均为：“晚上睡觉#身体部位##疾病#是怎么回事”。

在得到意图匹配泛化字典之后，可以根据意图匹配泛化字典的字典元素的元素结构构建输入数据编辑距离计算模块，以通过输入数据编辑距离计算模块计算输入数据与字典元素之间的编辑距离(也可称为相似度)。

S280、根据所述输入数据编辑距离计算模块和所述意图匹配泛化字典构建所述第一意图识别模型。

其中，第一意图识别模型用于识别非长尾输入数据的意图。

在本发明实施例中，第一意图识别模型可以包括输入数据编辑距离计算模块和意图匹配泛化字典两个模块。除此之外，第一意图识别模型还可以包括用于实体抽象的实体词字典。第一意图识别模型则可以用于对非长尾输入数据进行意图识别。

具体的，第一意图识别模型可以首先基于实体词字典对意图输出对象的输入query进行实体抽象得到初始抽象实体词，并对初始抽象实体词进行实体归类分组，得到最终的抽象泛化实体词。然后，第一意图识别模型可以计算抽象泛化实体词和意图匹配泛化字典中各个字典元素间的编辑距离。最后，第一意图识别模型将意图匹配泛化字典中和抽象泛化实体词之间编辑距离最小的字典元素包括的意图作为输入query的意图。可以理解的是，如果意图匹配泛化字典中和抽象泛化实体词之间编辑距离最小的字典元素包括的意图有多个，还可以根据各意图的排序结果选择首个意图作为输入query的意图。

S290、构建第二意图识别模型。

其中，第二意图识别模型可以用于对长尾输入数据进行意图识别，得到最终的意图理解结果。

在本发明的一个可选实施例中，构建第二意图识别模型可以包括：根据预训练样本数据对预设神经网络模型进行预训练，得到预训练神经网络模型；根据所述原始意图样本数据获取第二目标意图样本数据；其中，所述第二目标意图样本数据包括长尾输入样本数据和意图标记结果数据；根据所述第二目标意图样本数据对所述预训练神经网络模型进行训练，得到第二意图识别模型。

其中，预设神经网络模型可以是任意类型的可以实现意图识别功能的神经网络模型。预训练神经网络模型可以是对预设神经网络模型进行预训练得到的神经网络模型。第二目标意图样本数据可以是用于正式训练第二意图识别模型的样本数据。长尾输入样本数据可以是长尾形式的输入样本数据，具有语义具有复杂性的特点。意图标记结果数据可以是预先对长尾输入样本数据匹配的意图进行标记的数据。

在本发明实施例中，针对长尾输入样本数据可以采用神经网络模型进行意图识别。具体的，可以首先采用预训练样本数据对预设神经网络模型进行预训练，以训练预设神经网络模型的数据理解能力，得到预训练神经网络模型。在预训练完成后，可以进一步采用第二目标意图样本数据预训练神经网络模型进行训练，得到第二意图识别模型。

在一个具体的例子中，假设预设神经网络模型为BERT(Bidirectional EncoderRepresentation from Transformers，一种语言表征模型)模型，则对预设神经网络模型进行预训练可以包括两个预训练任务，一个是MLM(Masked Language Model，掩码语言模型)预训练任务，还有一个是NSP(Next Sentence Prediction，下句预测)预训练任务。其中，MLM预训练任务可以理解成完形填空任务，可以随机mask每一个句子中一定数量(如句子中15％)的词，用其上下文来做预测，例如，针对预训练样本数据“my dog is hairy”转换为“my dog is[MASK]”。此处将“hairy”进行了mask处理。然后采用非监督学习的方法预测mask位置的词是什么。NSP预训练任务可以理解为文本匹配任务。具体的，可以选取一些句子对A和B，其中50％的数据B是A的其中一个断句，剩余50％的数据B是语料库中随机选择的，以使网络学习其中的相关性。示例性的，假设句子A为：简化搜索运维人员的工作流程，提高运维人员的工作效率。句子B的其中一个短句可以为句子A的其中一个短句，句子B的另外一个短句则可以为随机选择的断句，例如，句子B可以为：简化搜索运维人员的工作流程，需要准时吃饭。上述预训练过程可以使得预训练神经网络模型理解两个句子之间的关系，从而能让预训练神经网络模型更好的适应上述数据处理的任务。

在一个具体的例子中，假设预设神经网络模型为BERT模型，则根据第二目标意图样本数据对BERT模型进行训练时，可以通过CrossEntropy损失函数和BP(BackPropagation，反向传播)传播机制，让模型自主学习和更新网络权重参数，实现训练过程，训练后的BERT模型作为第二意图识别模型。其中，BERT模型的训练过程可以参考图3所示。BERT是依托Transformers作为特征抽取器的强大预训练模型，鉴于其巨大的参数量和超强的特征表示能力，可以学习到文本中深层的语义信息。使用BERT对长尾输入数据进行embedding(嵌入)，可以将文本信息映射到高维向量空间，使用embedding vector(嵌入向量)表示对长尾输入数据的语义信息。

S2110、根据所述第一意图识别模型和所述第二意图识别模型构建目标意图识别模型。

其中，目标意图识别模型也即可以对任意类型的输入数据进行意图识别的模型。

S2120、获取待识别输入数据，对所述待识别输入数据进行分类，得到输入数据分类结果。

其中，所述输入数据分类结果包括长尾输入数据和非长尾输入数据。

其中，待识别输入数据可以是需要进行意图识别的输入数据。例如可以是用户实时输入的query数据，也可以是设备或程序等实时输入的query数据等。待识别输入数据可以是文本类型的数据，也可以是语音类型的数据，本发明实施例并不对待识别输入数据的数据类型进行限制。输入数据分类结果也即待识别输入数据的分类结果。

在获取到待识别输入数据之后，为了确定对待识别输入数据进行意图识别的模型，可以首先对待识别输入数据进行分类，确定待识别输入数据是长尾输入数据还是非长尾输入数据。

在本发明的一个可选实施例中，对所述待识别输入数据进行分类，可以包括：在确定所述待识别输入数据的数据长度小于或等于预设数据长度阈值的情况下，确定所述待识别输入数据的输入数据分类结果为非长尾输入数据；在确定所述待识别输入数据的数据长度大于所述预设数据长度阈值的情况下，确定所述待识别输入数据的输入数据分类结果为长尾输入数据。

其中，预设数据长度阈值可以是用于划分长尾数据和非长尾数据的长度阈值，示例性的，预设数据长度阈值可以设置为20或25等，具体可以根据实际需求设定，本发明实施例并不对预设数据长度阈值的具体数值进行限定。

具体的，可以确定待识别输入数据的数据长度，以通过数据长度对待识别输入数据进行分类。其中，数据长度可以是待识别输入数据中字或字符的数量，如针对待识别输入数据“晚上睡觉脚抽筋是怎么回事”，其数据长度为12。相应的，如果确定待识别输入数据的数据长度小于或等于预设数据长度阈值，则可以确定待识别输入数据的输入数据分类结果为非长尾输入数据；否则，确定待识别输入数据的输入数据分类结果为长尾输入数据。

S2130、判断待识别输入数据是否为非长尾输入数据，若是，则执行S2140，否则，执行S2150。

S2140、将所述待识别输入数据输入至所述第一意图识别模型中，以根据所述第一意图识别模型输出所述待识别输入数据的意图识别结果。

S2150、将所述待识别输入数据输入至所述第二意图识别模型中，以根据所述第二意图识别模型输出所述待识别输入数据的意图识别结果。

具体的，可以通过目标意图识别模型的第一意图识别模型对非长尾的输入数据进行意图识别，通过目标意图识别模型的第二意图识别模型对长尾的输入数据进行意图识别，从而得到输入数据的意图识别结果。

其中，第一意图识别模型可以基于大量行为的DFA算法，不仅能够提升意图识别效率，还具有很好的泛化性。第二意图识别模型可以很好的提取长尾输入数据隐含的语义信息，可以更好的表示其语义特征。通过对长尾和非长尾输入数据的差异化处理，可以更加精准识别、理解意图。

采用上述技术方案，通过分别构建第一意图识别模型和第二意图识别模型，以根据第一意图识别模型和第二意图识别模型共同组成目标意图识别模型，可以针对长尾输入数据和非长尾输入数据采用不同的模型进行意图识别，能够提高意图理解的准确性和高效性，从而提高用户体验。

需要说明的是，以上各实施例中各技术特征之间的任意排列组合也属于本发明的保护范围。

实施例三

图4是本发明实施例四提供的一种意图识别装置的示意图，如图4所示，所述装置包括：第一样本数据获取模块410、抽象泛化实体词获取模块420、意图匹配泛化字典生成模块430、第一意图识别模型构建模块440、待识别输入数据输入模块450以及意图识别结果输出模块460，其中：

第一样本数据获取模块410，用于根据原始意图样本数据获取第一目标意图样本数据；其中，所述第一目标意图样本数据包括非长尾输入样本数据和意图匹配结果排序数据；

抽象泛化实体词获取模块420，用于对所述非长尾输入样本数据进行实体抽象，得到抽象泛化实体词；

意图匹配泛化字典生成模块430，用于对所述抽象泛化实体词和所述意图匹配结果排序数据进行逻辑组合，以生成意图匹配泛化字典；

第一意图识别模型构建模块440，用于根据所述意图匹配泛化字典构建第一意图识别模型；

待识别输入数据输入模块450，用于在确定待识别输入数据为非长尾输入数据的情况下，将所述待识别输入数据输入至所述第一意图识别模型中；

意图识别结果输出模块460，用于根据所述第一意图识别模型输出所述待识别输入数据的意图识别结果。

可选的，第一样本数据获取模块410具体用于：根据非长尾输入数据筛选规则从所述原始意图样本数据中筛选所述非长尾输入样本数据；获取所述非长尾输入样本数据的关联意图反馈数据；对所述关联意图反馈数据进行排序，得到所述意图匹配结果排序数据。

可选的，抽象泛化实体词获取模块420具体用于：根据实体词字典对所述非长尾输入样本数据进行实体抽象，得到初始抽象实体词；对所述初始抽象实体词进行分类分组，得到所述抽象泛化实体词。

可选的，第一意图识别模型构建模块440具体用于：根据所述意图匹配泛化字典的字典元素构建输入数据编辑距离计算模块；根据所述输入数据编辑距离计算模块和所述意图匹配泛化字典构建所述第一意图识别模型。

可选的，意图识别装置还包括：预设神经网络模型预训练模块，用于根据预训练样本数据对预设神经网络模型进行预训练，得到预训练神经网络模型；第二目标意图样本数据获取模块，用于根据所述原始意图样本数据获取第二目标意图样本数据；其中，所述第二目标意图样本数据包括长尾输入样本数据和意图标记结果数据；第二意图识别模型获取模块，用于根据所述第二目标意图样本数据对所述预训练神经网络模型进行训练，得到第二意图识别模型；目标意图识别模型构建模块，用于根据所述第一意图识别模型和所述第二意图识别模型构建目标意图识别模型。

可选的，意图识别装置还包括：待识别输入数据获取模块，用于获取待识别输入数据；待识别输入数据分类模块，用于对所述待识别输入数据进行分类，得到输入数据分类结果；其中，所述输入数据分类结果包括长尾输入数据和非长尾输入数据。

可选的，待识别输入数据分类模块具体用于：在确定所述待识别输入数据的数据长度小于或等于预设数据长度阈值的情况下，确定所述待识别输入数据的输入数据分类结果为非长尾输入数据；在确定所述待识别输入数据的数据长度大于所述预设数据长度阈值的情况下，确定所述待识别输入数据的输入数据分类结果为长尾输入数据。

上述意图识别装置可执行本发明任意实施例所提供的意图识别方法，具备执行方法相应的功能模块和有益效果。未在本实施例中详尽描述的技术细节，可参见本发明任意实施例提供的意图识别方法。

由于上述所介绍的意图识别装置为可以执行本发明实施例中的意图识别方法的装置，故而基于本发明实施例中所介绍的意图识别方法，本领域所属技术人员能够了解本实施例的意图识别装置的具体实施方式以及其各种变化形式，所以在此对于该意图识别装置如何实现本发明实施例中的意图识别方法不再详细介绍。只要本领域所属技术人员实施本发明实施例中意图识别方法所采用的装置，都属于本申请所欲保护的范围。

实施例四

图5示出了可以用来实施本发明的实施例的电子设备10的结构示意图。电子设备旨在表示各种形式的数字计算机，诸如，膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置，诸如，个人数字处理、蜂窝电话、智能电话、可穿戴设备(如头盔、眼镜、手表等)和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例，并且不意在限制本文中描述的和/或者要求的本发明的实现。

如图5所示，电子设备10包括至少一个处理器11，以及与至少一个处理器11通信连接的存储器，如只读存储器(ROM)12、随机访问存储器(RAM)13等，其中，存储器存储有可被至少一个处理器执行的计算机程序，处理器11可以根据存储在只读存储器(ROM)12中的计算机程序或者从存储单元18加载到随机访问存储器(RAM)13中的计算机程序，来执行各种适当的动作和处理。在RAM 13中，还可存储电子设备10操作所需的各种程序和数据。处理器11、ROM 12以及RAM 13通过总线14彼此相连。输入/输出(I/O)接口15也连接至总线14。

电子设备10中的多个部件连接至I/O接口15，包括：输入单元16，例如键盘、鼠标等；输出单元17，例如各种类型的显示器、扬声器等；存储单元18，例如磁盘、光盘等；以及通信单元19，例如网卡、调制解调器、无线通信收发机等。通信单元19允许电子设备10通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。

处理器11可以是各种具有处理和计算能力的通用和/或专用处理组件。处理器11的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的处理器、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。处理器11执行上文所描述的各个方法和处理，例如意图识别方法。

在一些实施例中，意图识别方法可被实现为计算机程序，其被有形地包含于计算机可读存储介质，例如存储单元18。在一些实施例中，计算机程序的部分或者全部可以经由ROM 12和/或通信单元19而被载入和/或安装到电子设备10上。当计算机程序加载到RAM 13并由处理器11执行时，可以执行上文描述的意图识别方法的一个或多个步骤。备选地，在其他实施例中，处理器11可以通过其他任何适当的方式(例如，借助于固件)而被配置为执行意图识别方法。

本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、负载可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括：实施在一个或者多个计算机程序中，该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释，该可编程处理器可以是专用或者通用可编程处理器，可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令，并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。

用于实施本发明的方法的计算机程序可以采用一个或多个编程语言的任何组合来编写。这些计算机程序可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器，使得计算机程序当由处理器执行时使流程图和/或框图中所规定的功能/操作被实施。计算机程序可以完全在机器上执行、部分地在机器上执行，作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。

在本发明的上下文中，计算机可读存储介质可以是有形的介质，其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的计算机程序。计算机可读存储介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备，或者上述内容的任何合适组合。备选地，计算机可读存储介质可以是机器可读信号介质。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。

为了提供与用户的交互，可以在电子设备上实施此处描述的系统和技术，该电子设备具有：用于向用户显示信息的显示装置(例如，CRT(阴极射线管)或者LCD(液晶显示器)监视器)；以及键盘和指向装置(例如，鼠标或者轨迹球)，用户可以通过该键盘和该指向装置来将输入提供给电子设备。其它种类的装置还可以用于提供与用户的交互；例如，提供给用户的反馈可以是任何形式的传感反馈(例如，视觉反馈、听觉反馈、或者触觉反馈)；并且可以用任何形式(包括声输入、语音输入或者触觉输入)来接收来自用户的输入。

可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如，作为数据服务器)、或者包括中间件部件的计算系统(例如，应用服务器)、或者包括前端部件的计算系统(例如，具有图形用户界面或者网络浏览器的用户计算机，用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如，通信网络)来将系统的部件相互连接。通信网络的示例包括：局域网(LAN)、广域网(WAN)、区块链网络和互联网。

计算系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器，又称为云计算服务器或云主机，是云计算服务体系中的一项主机产品，以解决了传统物理主机与VPS服务中，存在的管理难度大，业务扩展性弱的缺陷。

实施例五

本发明实施例五还提供一种存储计算机程序的计算机存储介质，所述计算机程序在由计算机处理器执行时用于执行本发明上述实施例任一所述的意图识别方法。

其中，意图识别方法包括：根据原始意图样本数据获取第一目标意图样本数据；其中，所述第一目标意图样本数据包括非长尾输入样本数据和意图匹配结果排序数据；对所述非长尾输入样本数据进行实体抽象，得到抽象泛化实体词；对所述抽象泛化实体词和所述意图匹配结果排序数据进行逻辑组合，以生成意图匹配泛化字典；根据所述意图匹配泛化字典构建第一意图识别模型；在确定待识别输入数据为非长尾输入数据的情况下，将所述待识别输入数据输入至所述第一意图识别模型中；根据所述第一意图识别模型输出所述待识别输入数据的意图识别结果。

本发明实施例的计算机存储介质，可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件，或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括：具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ReadOnly Memory，ROM)、可擦式可编程只读存储器(Erasable Programmable Read OnlyMemory，EPROM，或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中，计算机可读存储介质可以是任何包含或存储程序的有形介质，该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。

计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号，其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式，包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质，该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。

计算机可读介质上包含的程序代码可以用任何适当的介质传输，包括但不限于无线、电线、光缆、射频(Radio Frequency，RF)等等，或者上述的任意合适的组合。

可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码，所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++，还包括常规的过程式程序设计语言，诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中，远程计算机可以通过任意种类的网络，包括局域网(LAN)或广域网(WAN)连接到用户计算机，或者，可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。

应该理解，可以使用上面所示的各种形式的流程，重新排序、增加或删除步骤。例如，本发明中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行，只要能够实现本发明的技术方案所期望的结果，本文在此不进行限制。

上述具体实施方式，并不构成对本发明保护范围的限制。本领域技术人员应该明白的是，根据设计要求和其他因素，可以进行各种修改、组合、子组合和替代。任何在本发明的精神和原则之内所作的修改、等同替换和改进等，均应包含在本发明保护范围之内。

Claims

1.一种意图识别方法，其特征在于，包括：

根据所述意图匹配泛化字典构建第一意图识别模型；

2.根据权利要求1所述的方法，其特征在于，所述根据原始意图样本数据获取第一目标意图样本数据，包括：

根据非长尾输入数据筛选规则从所述原始意图样本数据中筛选所述非长尾输入样本数据；

获取所述非长尾输入样本数据的关联意图反馈数据；

对所述关联意图反馈数据进行排序，得到所述意图匹配结果排序数据。

3.根据权利要求1所述的方法，其特征在于，所述对所述非长尾输入样本数据进行实体抽象，得到抽象泛化实体词，包括：

根据实体词字典对所述非长尾输入样本数据进行实体抽象，得到初始抽象实体词；

对所述初始抽象实体词进行分类分组，得到所述抽象泛化实体词。

4.根据权利要求1所述的方法，其特征在于，所述根据所述意图匹配泛化字典构建第一意图识别模型，包括：

根据所述意图匹配泛化字典的字典元素构建输入数据编辑距离计算模块；

根据所述输入数据编辑距离计算模块和所述意图匹配泛化字典构建所述第一意图识别模型。

5.根据权利要求1所述的方法，其特征在于，还包括：

根据预训练样本数据对预设神经网络模型进行预训练，得到预训练神经网络模型；

根据所述原始意图样本数据获取第二目标意图样本数据；其中，所述第二目标意图样本数据包括长尾输入样本数据和意图标记结果数据；

根据所述第二目标意图样本数据对所述预训练神经网络模型进行训练，得到第二意图识别模型；

根据所述第一意图识别模型和所述第二意图识别模型构建目标意图识别模型。

6.根据权利要求1所述的方法，其特征在于，在所述将所述待识别输入数据输入至所述第一意图识别模型中之前，还包括：

获取待识别输入数据；

对所述待识别输入数据进行分类，得到输入数据分类结果；其中，所述输入数据分类结果包括长尾输入数据和非长尾输入数据。

7.根据权利要求6所述的方法，其特征在于，所述对所述待识别输入数据进行分类，包括：

在确定所述待识别输入数据的数据长度小于或等于预设数据长度阈值的情况下，确定所述待识别输入数据的输入数据分类结果为非长尾输入数据；

在确定所述待识别输入数据的数据长度大于所述预设数据长度阈值的情况下，确定所述待识别输入数据的输入数据分类结果为长尾输入数据。

8.一种意图识别装置，其特征在于，包括：

9.一种电子设备，其特征在于，所述电子设备包括：

至少一个处理器；以及

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的计算机程序，所述计算机程序被所述至少一个处理器执行，以使所述至少一个处理器能够执行权利要求1-7中任一项所述的意图识别方法。

10.一种计算机存储介质，所述计算机可读存储介质存储有计算机指令，所述计算机指令用于使处理器执行时实现权利要求1-7中任一项所述的意图识别方法。