CN114764437A

CN114764437A - 用户意图识别方法、装置以及电子设备

Info

Publication number: CN114764437A
Application number: CN202110004971.3A
Authority: CN
Inventors: 林廷恩; 黎槟华; 武玉川; 李永彬; 孙健
Original assignee: Alibaba Group Holding Ltd
Current assignee: Alibaba Group Holding Ltd
Priority date: 2021-01-04
Filing date: 2021-01-04
Publication date: 2022-07-19

Abstract

本申请实施例提供了一种用户意图识别方法、装置以及电子设备，所述方法包括：获取待处理的用户对话数据；采用至少两种聚类算法对所述用户对话数据进行聚类，得到聚类结果；获取所述聚类结果之间的交集作为目标聚类结果；依据所述目标聚类结果进行用户意图识别，得到用户意图数据。本申请实施例利用至少两种聚类算法对应的聚类结果，并保留两者的交集作为目标聚类结果，由于仅保留了高质量的目标聚类结果，因此基于目标聚类结果进行用户意图识别，可以获得高质量的用户意图数据。

Description

用户意图识别方法、装置以及电子设备

技术领域

本申请实施例涉及计算机技术领域，特别是涉及一种用户意图识别方法、一种用户意图识别装置、一种电子设备以及一种存储介质。

背景技术

随着互联网的快速发展，建立在互联网之上的各种应用也层出不穷。为了提高用户的应用体验，通常需要挖掘用户的用户意图数据，以为用户提供与其用户意图相匹配的服务。

然而，目标的意图挖掘方法无法高效地从海量、高噪声且无标注的用户对话数据中，挖掘出高质量的用户意图数据，正是如此，也无法基于用户意图数据训练各种模型，为用户提供更好的服务。

因此，如何获取高质量的用户意图数据，是亟待解决的问题。

发明内容

本申请实施例提供了一种用户意图识别方法，以获取高质量的用户意图数据。

相应的，本申请实施例还提供了一种用户意图识别装置、一种电子设备以及一种存储介质，用以保证上述方法的实现及应用。

为了解决上述问题，本申请实施例公开了一种用户意图识别方法，所述方法包括：

获取待处理的用户对话数据；

采用至少两种聚类算法对所述用户对话数据进行聚类，得到聚类结果；

获取所述聚类结果之间的交集作为目标聚类结果；

依据所述目标聚类结果进行用户意图识别，得到用户意图数据。

可选地，在获取待处理的用户对话数据后，所述方法还包括：

对所述用户对话数据进行分词，得到对话分词；

确定所述对话分词的词性，保留包含指定词性的对话分词所对应的用户对话数据；

对保留的所述用户对话数据进行去重处理。

可选地，所述采用至少两种聚类算法对所述用户对话数据进行聚类，得到聚类结果，包括：

依据所述用户对话数据转换得到意图向量；

采用至少两种聚类算法对所述意图向量进行聚类，得到聚类结果。

可选地，所述依据所述用户对话数据转换得到意图向量，包括：

将所述用户对话数据转换为句向量；

采用自编码器对所述句向量进行降维处理，得到意图向量。

可选地，所述获取所述聚类结果之间的交集作为目标聚类结果，包括：

获取所述聚类结果之间的交集；

采用匈牙利算法确定所述交集中的最大交集，作为目标聚类结果。

可选地，所述目标聚类结果包括簇结果，所述依据所述目标聚类结果进行用户意图识别，得到用户意图数据，包括：

采用至少两种关键字提取算法，分别获取所述簇结果的关键字以及所述关键字对应的关键字分数；

从所述关键字提取算法对应的关键字分数中，分别确定最高关键字分数；

针对所述关键字，采用所述关键字提取算法对应的关键字分数以及所述最高关键字分数计算权重总分数；

依据所述权重总分数从所述关键字中提取出目标关键字。

可选地，还包括：

计算所述目标关键字与指定语料，在指定窗口大小内的共现次数；所述指定窗口大小用于表征在一文本中所述目标关键字与所述指定语料之间允许出现的单词的数量，所述共现次数用于表征所述目标关键字与所述指定语料同时出现的次数；

当所述共现次数满足预设阈值时，将所述目标关键字和指定语料组合为关键短语。

可选地，还包括：

依据所述簇结果的所述目标关键字的所述权重总分数得到簇分数；

按照所述簇分数在所述聚类结果中对所述簇结果进行排序；

依据排序结果从所述簇结果中确定目标簇结果。

可选地，所述依据所述簇结果的所述目标关键字的所述权重总分数得到簇分数，包括：

对所述簇结果的所述目标关键字的权重总分数进行求和，得到权重和值；

当所述簇结果包括所述关键短语时，将所述权重和值与预设分数之和作为簇分数；

当所述簇结果不包括所述关键短语时，将所述权重和值作为簇分数。

可选地，还包括：

获取所述簇结果中的用户对话数据的意图向量，以及获取所述簇结果的簇中心向量；

计算所述意图向量与所述簇中心向量之间的向量距离，作为所述用户对话数据的句分数；

按照所述句分数对所述簇结果中的所述用户对话数据进行排序；

依据排序结果，从所述簇结果中的用户对话数据中筛选出目标用户对话数据。

可选地，在所述依据排序结果，从所述簇结果中的用户对话数据中筛选出目标用户对话数据之前，所述方法还包括：

当所述簇结果中包括关键短语时，去除所述所述簇结果中不包含关键短语的所述用户对话数据。

可选地，还包括：

确定与所述用户意图数据关联的意图名称；所述用户意图数据包括所述关键字、所述关键短语以及所述目标用户对话数据；

依据所述意图名称以及所述用户意图创建意图结构体系。

可选地，所述意图名称包括行业和行业中的场景。

本申请实施例还公开了一种用户意图识别装置，所述装置包括：

用户对话数据获取模块，用于获取待处理的用户对话数据；

聚类结果得到模块，用于采用至少两种聚类算法对所述用户对话数据进行聚类，得到聚类结果；

目标聚类结果获取模块，用于获取所述聚类结果之间的交集作为目标聚类结果；

用户意图识别模块，用于依据所述目标聚类结果进行用户意图识别，得到用户意图数据。

本申请实施例还公开了一种电子设备，包括：处理器；和存储器，其上存储有可执行代码，当所述可执行代码被执行时，使得所述处理器执行如本申请实施例中一个或多个所述的方法。

本申请实施例还公开了一个或多个机器可读介质，其上存储有可执行代码，当所述可执行代码被执行时，使得处理器执行如本申请实施例中一个或多个所述的方法。

与相关技术相比，本申请实施例包括以下优点：

在本申请实施例中，获取待处理的用户对话数据，采用至少两种聚类算法对用户对话数据进行聚类，得到聚类结果，然后获取聚类结果之间的交集作为目标聚类结果，依据目标聚类结果进行用户意图识别得到用户意图数据。本申请实施例利用至少两种聚类算法对应的聚类结果，并保留两者的交集作为目标聚类结果，由于仅保留了高质量的目标聚类结果，因此基于目标聚类结果进行用户意图识别，可以获得高质量的用户意图数据。

附图说明

为了更清楚地说明本申请的技术方案，下面将对本申请的描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1是本申请的一种用户意图识别方法实施例的步骤流程图；

图2是本申请的一种自编码器的架构示意图；

图3是本申请的一种高维、稀疏的句向量的示意图；

图4是本申请的一种低维、稠密的意图向量的示意图；

图5是本申请的一种聚类结果的交集的示意图；

图6是本申请的一种聚类摘要的示意图；

图7是本申请的一种聚类结果排序的示意图；

图8是本申请的一种簇结果的排序比对示意图；

图9是本申请的一种用户意图数据的提交示意图；

图10是本申请的一种意图结构体系的构建流程图；

图11是本申请的一种用户意图识别装置实施例的结构框图；

图12是本申请一实施例提供的装置的结构示意图。

具体实施方式

为使本申请的上述目的、特征和优点能够更加明显易懂，下面结合附图和具体实施方式对本申请作进一步详细的说明。

参照图1，示出了本申请的一种用户意图识别方法实施例的步骤流程图，具体可以包括如下步骤：

步骤102、获取待处理的用户对话数据。

在具体实现中，在大量用户智能手机、平板电脑、个人计算机等电子设备上，都安装有对话应用，基于对话应用，用户可以通过文本或者语音等方式与客服进行交流，从而通过对话应用帮助用户解决各种类型的问题。

在对话应用中，随着时间增长，积累了大量、无标注的对话文本或者通话录音，这些对话文本或者通话录音蕴含用户所要向客服表达的需求，例如对社保的需求，对优惠的需求，对导航的需求等等。

例如，在一通话录音中，其包含的用户对话数据可以有：

“您好，我是458号服务人员，请问有什么能够帮助到您的吗？”

“那个那个，我想问下，上次充值优惠了八折，为啥这次只打了九点五折啊”

“您好，请问您上一次充值是在哪个地点”

“哦哦，是这样子的，就是那个在火车站的一个你们的定点充值的，我充了100，然后有人告诉我优惠了八折的”

……。

本申请实施例，将对话文本作为待处理的用户对话数据，或者，对通话录音进行文本转换，将转换后的文本作为待处理的用户对话数据。当然，除了从对话应用中获取用户对话数据之外，还可以通过其他方式获取用户对话数据，本发明实施例对此无需加以限制。可选地，可以通过ASR(Automatic Speech Recognition，自动语音识别技术)从通话录音中识别出用户对话数据。

步骤104、采用至少两种聚类算法对所述用户对话数据进行聚类，得到聚类结果。

其中，聚类算法可以包括K-means算法、层次聚类算法、均值漂移聚类算法、基于密度的聚类算法、基于高斯混合模型的最大期望聚类算法和图团体检测聚类算法等等。

在本申请实施例中，利用不同的聚类算法，分别对用户对话数据进行聚类，从而得到各个聚类算法的不同的聚类结果。可以理解，由于不同的聚类算法对数据处理方式不同，因此得到的聚类结果也存在一定差异。

举例来说，可以利用K-means算法和层次聚类算法，分别对用户对话数据进行聚类，得到K-means算法对应的聚类结果，以及层次聚类算法对应的聚类结果。

步骤106、获取所述聚类结果之间的交集作为目标聚类结果。

在本申请实施例中，对于利用不同聚类算法所得的聚类结果，将提取出这些聚类结果之间的交集，作为目标聚类结果。其中，目标聚类结果是不同聚类算法的交集，换而言之，不同的聚类算法都能得到聚类结果，代表聚类结果较为一致，因此，数据质量较高。

步骤108、依据所述目标聚类结果进行用户意图识别，得到用户意图数据。

在本申请实施例中，基于目标聚类结果进行用户意图识别，从而得到能够反映用户意图的用户意图数据。

在上述意图识别方法中，获取待处理的用户对话数据，采用至少两种聚类算法对用户对话数据进行聚类，得到聚类结果，然后获取聚类结果之间的交集作为目标聚类结果，依据目标聚类结果进行用户意图识别得到用户意图数据。本申请实施例利用至少两种聚类算法对应的聚类结果，并保留两者的交集作为目标聚类结果，由于仅保留了高质量的目标聚类结果，因此基于目标聚类结果进行用户意图识别，可以获得高质量的用户意图数据。

本申请的一种可选实施例中，所述方法还包括：

对所述用户对话数据进行分词，得到对话分词；

对保留的所述用户对话数据进行去重处理。

在本申请实施例中，对于用户对话数据，尤其是通过语音识别技术识别出的用户对话数据，将进行数据前处理。具体地，数据前处理是对用户对话数据行分词、词性抽取、去重等操作，从而只保留高质量的用户对话数据，将其他不符合条件的无用户意图的用户对话数据滤除。其中，词性是以词的特点作为划分词类的根据，例如可以分为：实词：名词、动词、形容词、数量词、代词；虚词：副词、介词、连词、助词、叹词、拟声词，等等。

作为本申请一种示例，指定词性是指的同时包含名词和动词。首先对用户对话数据进行分词得到多个对话分词，使用结巴分词工具包中的词性标注函数，从对话分词中确定词性并进行词性标注，然后保留同时包含指定词性的用户对话数据，最后，如果保留的用户对话数据中存在重复的句子，则对重复的用户对话数据进行去重处理。可选地，词性标注算法具体使用的是(基于统计方法的)隐马尔科夫模型，并通过维特比算法计算词性最优状态。

在上述实施例中，通过对用户对话数据进行数据前处理，从而过滤一些无法反映用户意图的用户对话数据，例如“呃呃呃”、“那行吧”、“那我挂了啊”等无效的用户对话数据，以及去除重复的用户对话数据，从而只保留高质量的用户对话数据，有利于提高用户意图识别的准确性。

本申请的一种可选实施例中，所述步骤104、采用至少两种聚类算法对所述用户对话数据进行聚类，得到聚类结果，包括：

依据所述用户对话数据转换得到意图向量。

在本申请实施例中，将用户对话数据转换为意图向量，然后再利用至少两种聚类算法对意图向量进行聚类，得到聚类结果。

本申请的一种可选实施例中，所述依据所述用户对话数据转换得到意图向量，包括：

将所述用户对话数据转换为句向量；

采用自编码器对所述句向量进行降维处理，得到意图向量。

具体地，意图向量是将经过数据前处理后的高质量的用户对话数据转换为TF-IDF(Term Frequency–Inverse Document Frequency，词频-逆文本频率指数)表示的句向量，然后利用自编码器对句向量进行降维处理，从而将高维、稀疏的句向量，压缩成低维、稠密的意图向量。其中，在得到句向量后，还可以加入n-gram特征、过滤停用词、限制最低词频等来提升句向量的表示能力。

参照图2，为一种自编码器(autoencoder)的架构示意图，自编码器是神经网络中用于降维的经典模型，具体地，自编码器对句向量的处理过程为：

1、给定词表大小V(约2000～10000)和预定义聚类中心数N(约10～100)，输入句子(用户对话数据)数量M；

2、输入inputX：为M*V维的句向量(通过TF-IDF表示，高维稀疏)，如图3；

3、输出outputX’：为M*V维的句向量(通过TF-IDF表示，高维稀疏)，如图4；

4、意图向量z：为M*N维的意图向量(中间结果，所需的数据)；

5、编码器(encoder)：为可学习的参数矩阵，维度为V*N；

6、解码器(decoder)：为可学习的参数矩阵，维度为N*V；

7、通过矩阵计算，可以获得意图向量z＝输入·编码器＝M*V·V*N＝M*N；

8、通过矩阵计算，可以获得输出X’＝意图向量·解码器＝M*N·N*V＝M*V；

9、当模型收敛后，取出意图向量z，作为后续的输入数据。

其中，在整个自编码器神经网络模型中，可以通过反向传播和梯度下降法来优化可学习的参数矩阵；其中使用的损失函数为均方误差(MSE，Means Square Error)，

当然，除了可以通过自编码器对句向量进行压缩之外，还可以通过PCA(PrincipalComponent Analysis，主成分分析)算法、深度学习模型等其他方式进行压缩，本申请实施例对并不加以限制。

在上述实施例中，对于用户对话数据转换为句向量后，通过自编码器将高维、稀疏的句向量压缩成低维、稠密的意图向量，提高基于意图向量识别用户意图的准确性。

本申请的一种可选实施例中，所述获取所述聚类结果之间的交集作为目标聚类结果，包括：

获取所述聚类结果之间的交集；

在本申请实施例中，在基于聚类算法得到聚类结果之后，例如在得到K-means算法对应的聚类结果，以及层次聚类算法对应的聚类结果后，可以确定这两个聚类结果之间的交集，然后将交集作为目标聚类结果，用于后续的用户意图识别。

具体地，在意图向量上运行K-means算法和层次聚类等聚类算法，将多次聚类结果通过匈牙利算法求解最大匹配问题进行集成，保留高质量的聚类结果。上述处理方式的核心思想是，如果不同的聚类算法都能聚出相同的结果，代表聚类结果是较为一致的，因此聚类结果的数据质量高。参照图3，不同深浅颜色的圆圈分别代表了两种不同聚类算法的聚类结果，通过匈牙利算法求解最大匹配问题，只保留两个聚类结果的最大交集，即图3中“√”的部分。

在上述实施例中，将不同聚类算法的得到聚类结果，通过匈牙利算法求解最大匹配问题进行集成，保留高质量的聚类结果。

本申请的一种可选实施例中，所述目标聚类结果包括簇结果，所述依据所述目标聚类结果进行用户意图识别，得到用户意图数据，包括：

依据所述权重总分数从所述关键字中提取出目标关键字。

在本申请实施例中，在聚类结果中可以包括多个簇结果。例如，一个聚类结果中，可以包括针对“社保”的簇结果，针对“公积金”的簇结果，针对“流动人口调查”的簇结果等等，此外，在每个簇结果中，也可以包括多个对应的用户对话数据。

其中，关键字提取算法可以是TextRank和TF-IDF等关键字提取算法。在本申请实施例中，利用不同的关键字词提取算法，分别从簇结果中的用户对话数据中提取关键字以及该关键字对应的关键字分数，然后通过加权投票集成计算topK关键字，即目标关键字。

具体地，将用户对话数据分别通过TF-IDF和TextRank进行关键字挖掘后，可以得到每个关键字对应的TF-IDF分数，以及TextRank分数，例如：

[关键字，TF-IDF分数]

手机，2

电池，1.5...

[关键字，TextRank分数]

电池，5

手机，4...

对于不同关键字提取算法计算出来的关键字分数，通过加权投票集成来进一步从关键字中确定出目标关键字，其中，加权投票集成是将关键字分数标准化后相加，具体地：

标准化分数＝开根号(关键字分数/该用户对话数据内的最高关键字分数)

[关键字，TF-IDF分数]

手机，

电池，

...

[关键字，TextRank分数]

电池，

手机，

...

[关键字，TF-IDF+TextRank(加权投票集成)]

手机，1.89＝1+0.89

电池，1.86＝1+0.86

...

综上可知，关键字“手机”经过加权投票集成后的计算权重总分数为1.89，关键字“电池”经过加权投票集成后的计算权重总分数为0.86。

在得到关键字对应的权重总分数后，就可以依据权重总分数进一步从关键字中确定目标关键字，假设只需要3个目标关键字，则只需要提取权重总分数排序在top3的关键字，作为目标关键字即可。

在上述实施例中，通过加权投票集成，从用户对话数据中提取的关键字中进一步提取出目标关键字，因此将目标关键字作为簇结果的聚类摘要，可以更加真实且准确反映簇结果的中心内容。

本申请的一种可选实施例中，所述方法还包括：

其中，指定语料是用于与目标关键字组合的语料，可以是基于关键字提取算法从用户对话数据中提取出来关键字，此外，也可以是一些与目标关键字高频的组合单词。例如，假设有目标关键字“失业”，则指定语料可以是“补贴”或者“保险”。指定窗口大小是指的目标关键字与指定语料之间允许出现的单词数量，例如，假设指定窗口大小是2，则表示目标关键字与指定语料之间允许不存在一个单词。

其中，共现次数是指的目标关键字与所述指定语料同时出现的次数，例如，假设在一个通话录音的用户对话数据中，目标关键字与指定语料在5条用户对话数据中同时出现，则共现次数是5。

在本申请实施例中，在得到关键字后，还可以进一步基于关键字进行关键短语的提取。具体地，根据提取的目标关键字，计算目标关键字在指定语料和指定窗口大小内的共现次数，如果高于预设阈值n，则将目标关键字和指定语料组合成关键短语。

作为一种具体示例，指定窗口大小n可以设置为2，代表这两个单词必须紧挨著才算满足组合条件,假设设置指定窗口大小为2，已知两个关键字为“失业”&“保险”，则：

失业保险(可列入共现次数计算，两个词紧挨着)

失业好久保险怎弄(“失业”和“保险”没有紧挨著，超过了指定窗口大小2，因此不能列入共现次数的计算)。

其中，如果“失业”和“保险”满足组合条件，即在指定窗口大小的共现次数满足预设阈值，则可以将“失业”和“保险”组合为关键短语“失业保险”。

在上述实施例中，将指定窗口大小和共现次数作为组合条件，并将满足组合条件的目标关键字与指定语料组合为关键短语，因此将关键短语作为簇结果的聚类摘要，可以更加真实且准确反映簇结果的中心内容。

参照图6，所示为一种聚类摘要的示意图，具体地，图中左侧部分为多个簇结果，图中右侧为簇结果中的聚类结果，即用户对话数据，在获取到簇结果的聚类摘要，即关键字和关键短语(图中左侧框选部分)后，可以在簇结果下对应展示，以供用户快速知晓该簇结果的大致内容。

本申请的一种可选实施例中，所述方法还包括：

按照所述簇分数在所述聚类结果中对所述簇结果进行排序；

依据排序结果从所述簇结果中确定目标簇结果。

在本申请实施例中，在得到目标聚类结果后，还将对目标聚类结果中的簇结果，重新进行排序，以挑选出符合用户意图的目标簇结果。其中，簇分数越高则代表簇结果的质量越高，其核心思想是，如果不同聚类算法都能提取出相同的关键字，代表这个簇结果内的主题较为一致。

具体地，将每个簇结果中的目标关键字中的权重总分数作为簇分数，例如，假设一个簇结果中的目标关键字有三个，对应的权重总分数分别是0.23、0.57、0.8，则该簇结果的簇分数为1.60。然后，将聚类结果中的簇结果，按照簇分数按照由大到小的顺序进行排序，再依据排序结果从簇结果中确定目标簇结果，例如，假设聚类结果中包括簇结果1、簇结果2、簇结果3、簇结果4，对应的簇分数分别是8.9、9.0、7.8、8.8，则重新排序后为簇结果2、簇结果1、簇结果4、簇结果3，假设只需要排序在top2的簇结果，则最终可以挑选出的目标簇结果为簇结果2、簇结果1。可选地，目标簇结果可以由用户自行挑选，也可以依据预先设置的条件自动挑选，以减少人力成本。

在上述实施例中，依据簇结果的簇分数，对聚类结果中的簇结果进行排序，从而可以从中挑选出能够更加能够反映用户意图的用户对话数据，进而提高用户意图识别的准确性。

本申请的一种可选实施例中，所述依据所述簇结果的所述目标关键字的所述权重总分数得到簇分数，包括：

在本申请实施例中，部分的簇结果能够成功提取关键短语，关键短语的特征是比较长，往往是2-3个单词组成，甚至是短语，因此能够表达更加准确内容，若基于该关键短语进行搜索，相对于单个的单词，能够更加准确地确定用户意图，故而，对于成功提取出关键短语的簇结果，可获得额外的预设分数进行加分。

具体地，首先对簇结果中的目标关键字的权重总分数进行求和，得到权重和值，如果簇结果中成功提取了关键短语，则将权重和值与预设分数之和作为簇分数，如果簇结果中没有成功提取关键短语，则将权重和值作为簇分数。

在上述实施例中，对于成功提取关键短语，采用额外加分的方式计算簇分数，由于关键短语能够更加准确反映用户意图，故而对包含关键短语的簇结果进行额外加分，可以提高簇结果排序的准确性。

本申请的一种可选实施例中，所述方法还包括：

在本申请实施例中，计算簇结果中用户对话数据的意图向量与该簇结果的中心向量的向量距离(欧式距离)作为句分数，然后依据句分数对簇结果内的用户对话数据重新进行排序，以挑选出符合用户意图的目标对用户对话数据。其中，句分数越低(距离越短)则代表质量越高，其核心思想是，如果意图向量越靠近簇中心，则越具备代表性。

具体地，获取簇结果中的用户对话数据的意图向量的意图向量，以及，簇结果的中心向量，并计算出向量距离，从而得到用户对话数据的句分数，假设簇结果中包括用户对话数据1、用户对话数据2、用户对话数据3、用户对话数据4，对应的句分数分别是1、1.2、0.5、1.8，则重新排序后为用户对话数据4、用户对话数据2、用户对话数据1、用户对话数据3，假设只需要排序在top2的用户对话数据，则最终可以挑选出的目标簇结果为簇结果2、簇结果1。可选地，簇结果中的目标用户对话数据可以由用户自行挑选，也可以依据预先设置的条件自动挑选，以减少人力成本。

参照图7，所示为一种聚类结果排序的示意图，具体地，图中左侧部分为多个簇结果的簇得分(簇分数)排序，图中右侧为簇结果中的聚类结果(用户对话数据)排序，在获取到簇结果的簇分数后，按照从大到小的顺序进行排序，以及在获取到簇结果中的用户对话数据的句分数后，按照从大到小的顺序进行排序，以供用户快速定位到高质量的聚类结果。通过将依据从大到小的顺序对簇结果，以及簇结果中的用户对话数据进行排序，可以将相关度较低、质量较低的聚类结果放置在靠后的位置，具体参照图8，可以看出，排序靠前的簇结果，内容更加准确以及丰富，而排序靠后的簇结果，内容不清楚且稀疏。这样，用户在挑选用户意图数据时，可以提高挑选速度，减少不必要时间。

在上述实施例中，依据簇结果中用户对话数据与簇结果的中心向量的距向量距离，对簇结果中的用户对话数据进行排序，从而可以从中挑选出能够更加能够反映用户意图的用户对话数据，进而提高用户意图识别的准确性。

本申请的一种可选实施例中，在所述依据排序结果，从所述簇结果中的用户对话数据中筛选出目标用户对话数据之前，所述方法还包括：

在本申请实施例中，如果簇结果成功提取出关键短语，则挑选的目标用户对话数据中必须至少包含其中一个关键短语，因此可以在计算向量距离之前，将簇结果中不包含关键短语的用户对话数据提前去除。当然，也可以是是确定了簇结果中的目标用户对话数据后，再从中去除不包含关键短语的用户对话数据，本申请实施例对此无需加以限制。

在上述实施例中，去除不包含关键短语的用户对话数据，使得最终提交的用户意图数据能够准确地反映用户意图。

本申请的一种可选实施例中，所述方法还包括：

依据所述意图名称以及所述用户意图创建意图结构体系。

其中，意图名称是指的与用户意图数据关联的，反映用户需求的行业和行业中的场景。具体地，行业可以包括政务、金融、移动、交通、能源、旅游、税务等，行业中的场景则可以分别包括：政务：社保、公积金、满意度外呼、公安、城管、社会保障、住房保障、流动人口调查等场景；金融：银行催收、保险离职单回访、保险新契约回访、保险导航、银行导航等场景；能源：热力、燃气场景。

当然，上述行业以及行业中的场景仅仅是作为示例，在实际应用中，可以根据不同的需求进行调整设置，本申请实施例对此无需加以限制。

在本申请实施例中，在得到用户意图数据后，根据用户意图数据确定关联的意图名称，例如可以是“政务-社会保障”、“金融-银行导航”、“能源-热力”。可选地，意图名称可以是基于用户意图数据从已有的行业-场景列表中自动挑选，也可以是用户自行从有的行业-场景列表中自行挑选，还可以是由用户手动输入，本申请实施例对此无需加以限制。

其中，在得到意图名称、关键字、关键短语、目标用户对话数据等用户意图数据后，可以进一步将用户意图数据提交至下游数据处理中心，以基于这些意图数据进行模型训练等处理，从而为用户提供更好服务。例如，可以利用用户意图数据训练对话应用，从而使得对话应用能够为用户提供更好地对话服务。

另外，在本申请实施例中，还可以基于获取到的用户意图数据创建意图结构体系，具体地，意图结构体系从上而下呈现为：行业-场景-用户意图数据的树状结构体系。可选地，可以通过过少量人工对挖出的用户意图数据进行把关，最后整理并输出最后的意图体系结构，再提交至下游数据处理中心。

参照图9，在得到簇结果后，可以点开展开按钮(1)读取簇结果内的用户对话数据，那么该簇结果内的用户对话数据将展示在右侧下方，并且在这些用户对话数据中包括有复选框(2)，用户可以通过复选框勾选代表话术，即目标用户对话数据，另外，在意图名称一栏中，用户可以输入与该簇结果关联的意图名称，例如“政务-失业保险”，在确定了代表话术和意图名称后，可以点击提交意图按钮(3)，将代表话术和意图名称提交至下游数据中心处理，作进一步处理。

在上述实施例中，通过在海量的用户对话数据中精准地挖掘高质量的用户意图数据并构建意图结构体系，大幅降低了从零到一构建意图结构体系所需耗费的人力和时间。

为了使本领域技术人员更好地理解本申请实施例，下面采用一个完整示例，对于本申请实施例实现意图结构体系构建的过程进行说明。参照图10，为本申请的一种意图结构体系构建的流程示意图，具体地，主要步骤具体可以包括：

1、获取无标注数据：在对话应用中与客服之间的用户对话数据，例如“这个利率是怎么算”、“这门课是怎么优惠？”、“需要提交哪些材料”等等；

2、数据前处理：对用户对话数据进行分词、词性抽取、保留包含意图的句子(用户对话数据)；

3、意图表示：通过TF-IDF将数据前处理后的用户对话数据向量化得到句向量，并通过自编码器将句向量降维为意图向量；

4、聚类算法：通过不同聚类算法(例如K-means聚类算法、层次聚类算法)对意图向量进行聚类，得到不同聚类算法对应的聚类结果；进一步，还将利用匈牙利算法获取不同聚类算法对应的聚类结果之间的最大交集，作为目标聚类结果；

5、聚类摘要：通过不同关键字抽取算法(例如TextRank、IF-IDF)提取目标聚类结果中的关键字，然后通过加权投票集成，基于不同关键字抽取算法确定每个关键词以及关键词分数，进一步从关键词中确定目标关键词；

6、聚类结果重排序：对于聚类结果中的簇结果(簇中心)，依据簇结果中的目标关键字的关键词分数确定簇分数，从而基于簇分数进行排序筛选高质量的簇结果；对于簇结果中的用户对话数据，计算用户对话数据的意图向量与簇结果的中心向量之间的距离作为句分数，从而基于句分数进行排序筛选高质量的代表句；

7、意图体系结构：基于已获取的用户意图数据，通过人工或者自动方式，确定聚类结果的意图名称，然后将意图名称与代表句等用户意图数据，构建行业上而下呈现为：行业-场景-用户意图数据的树状结构体系。

在上述示例中，至少包括有如下优点：

首先，在数据前处理时大幅消除了低质量、不包含意图的用户对话数据如"啊啊"、"你是说"、"那个你这个"的干扰；

其次，在运行多次的聚类结果上，通过匈牙利算法求解最大匹配问题来进行集成学习，保留了高质量的聚类结果，有效地降低自动语音识别技术对通话录音中的错词错字所带来的影响；

最后，通过关键字提取算法提取聚类摘要时，通过加权投票集成，提取高质量关键词和关键短语，大量节省整理意图体系所需的人力。

在本实施例中，对于在对话应用中积累了大量、无标注的通话录音，这些录音蕴含着许多对话开发平台平台尚未覆盖、在不同行业和行业中的场景下的用户意图。因此，在本实施例中，可以将通话录音转换为用户对话数据，然后通过聚类算法自动从海量、噪声高且无标注的用户对话数据中挖掘出高质量的用户意图数据，并将其整合至对话开发平台中进行复用，提升对话开发平台在各行业和行业中的场景的意图覆盖率。同时，加速AIT(Artificial Intelligence Trainer，人工智能训练师)的工作效率，使其在对外项目竞争、POC(Proof of Concept，测试)等事务时，更具备竞争力。

应用本实施例，在云呼客服中心上运行，在挖掘700w的通话记录约耗时三小时，后续人工每小时约可整理出几十个甚至更多的新的意图结构体系，大幅提升了意图在个行业和行业中的场景的覆盖范围。

在相关技术方案中，仅将用户与客服在电话中开场的多个句子合并成单一句子，并且只针对这些句子挖掘用户意图，抛弃了一个对话中用户所有后续的其他输入语句(例如客服的反馈语句)，因此，本申请实施例是针对一整个用户与客服通话的录音通话进行整体的意图识别处理，这是考虑到在真实场景中，客户的后续问题和意图也扮演著相当重要的角色，故而在本申请实施例中将这些句子也纳入意图识别，而不是对这些句子直接抛弃掉，这样有利于充分挖掘分析出用户意图。

需要说明的是，对于方法实施例，为了简单描述，故将其都表述为一系列的动作组合，但是本领域技术人员应该知悉，本申请实施例并不受所描述的动作顺序的限制，因为依据本申请实施例，某些步骤可以采用其他顺序或者同时进行。其次，本领域技术人员也应该知悉，说明书中所描述的实施例均属于优选实施例，所涉及的动作并不一定是本申请实施例所必须的。

在上述实施例的基础上，本申请实施例还提供了一种用户意图识别装置，应用于服务器等电子设备中。

参照图11，示出了本申请的一种用户意图识别装置实施例的结构框图，具体可以包括如下模块：

用户对话数据获取模块1102，用于获取待处理的用户对话数据；

聚类结果得到模块1104，用于采用至少两种聚类算法对所述用户对话数据进行聚类，得到聚类结果；

目标聚类结果获取模块1106，用于获取所述聚类结果之间的交集作为目标聚类结果；

用户意图识别模块1108，用于依据所述目标聚类结果进行用户意图识别，得到用户意图数据。

本申请的一种可选实施例中，所述装置还包括：数据前处理模块，用于对所述用户对话数据进行分词，得到对话分词；确定所述对话分词的词性，保留包含指定词性的对话分词所对应的用户对话数据；对保留的所述用户对话数据进行去重处理。

本申请的一种可选实施例中，所述聚类结果得到模块1104，用于依据所述用户对话数据转换得到意图向量；采用至少两种聚类算法对所述意图向量进行聚类，得到聚类结果。

本申请的一种可选实施例中，所述聚类结果得到模块1104，用于将所述用户对话数据转换为句向量；采用自编码器对所述句向量进行降维处理，得到意图向量。

本申请的一种可选实施例中，所述目标聚类结果获取模块1106，用于获取所述聚类结果之间的交集；采用匈牙利算法确定所述交集中的最大交集，作为目标聚类结果。

本申请的一种可选实施例中，所述目标聚类结果包括簇结果，所述用户意图识别模块1108，用于采用至少两种关键字提取算法，分别获取所述簇结果的关键字以及所述关键字对应的关键字分数；从所述关键字提取算法对应的关键字分数中，分别确定最高关键字分数；针对所述关键字，采用所述关键字提取算法对应的关键字分数以及所述最高关键字分数计算权重总分数；依据所述权重总分数从所述关键字中提取出目标关键字。

本申请的一种可选实施例中，所述用户意图识别模块1108，还用于计算所述目标关键字与指定语料，在指定窗口大小内的共现次数；所述指定窗口大小用于表征在一文本中所述目标关键字与所述指定语料之间允许出现的单词的数量，所述共现次数用于表征所述目标关键字与所述指定语料同时出现的次数；当所述共现次数满足预设阈值时，将所述目标关键字和指定语料组合为关键短语。

本申请的一种可选实施例中，所述用户意图识别模块1108，还用于依据所述簇结果的所述目标关键字的所述权重总分数得到簇分数；按照所述簇分数在所述聚类结果中对所述簇结果进行排序；依据排序结果从所述簇结果中确定目标簇结果。

本申请的一种可选实施例中，所述所述用户意图识别模块1108，还用于对所述簇结果的所述目标关键字的权重总分数进行求和，得到权重和值；当所述簇结果包括所述关键短语时，将所述权重和值与预设分数之和作为簇分数；当所述簇结果不包括所述关键短语时，将所述权重和值作为簇分数。

本申请的一种可选实施例中，所述用户意图识别模块1108，还用于获取所述簇结果中的用户对话数据的意图向量，以及获取所述簇结果的簇中心向量；计算所述意图向量与所述簇中心向量之间的向量距离，作为所述用户对话数据的句分数；按照所述句分数对所述簇结果中的所述用户对话数据进行排序；依据排序结果，从所述簇结果中的用户对话数据中筛选出目标用户对话数据。

本申请的一种可选实施例中，所述所述用户意图识别模块1108，还用于当所述簇结果中包括关键短语时，去除所述所述簇结果中不包含关键短语的所述用户对话数据。

本申请的一种可选实施例中，所述所述用户意图识别模块1108，还用于确定与所述用户意图数据关联的意图名称；所述用户意图数据包括所述关键字、所述关键短语以及所述目标用户对话数据；依据所述意图名称以及所述用户意图创建意图结构体系。

本申请的一种可选实施例中，所述意图名称包括行业和行业中的场景。

本申请实施例还提供了一种非易失性可读存储介质，该存储介质中存储有一个或多个模块(programs)，该一个或多个模块被应用在设备时，可以使得该设备执行本申请实施例中各方法步骤的指令(instructions)。

本申请实施例提供了一个或多个机器可读介质，其上存储有指令，当由一个或多个处理器执行时，使得电子设备执行如上述实施例中一个或多个所述的方法。本申请实施例中，所述电子设备包括终端设备、服务器(集群)等各类型的设备。

本公开的实施例可被实现为使用任意适当的硬件，固件，软件，或及其任意组合进行想要的配置的装置，该装置可包括终端设备、服务器(集群)等电子设备。图12示意性地示出了可被用于实现本申请中所述的各个实施例的示例性装置1200。

对于一个实施例，图12示出了示例性装置1200，该装置具有一个或多个处理器1202、被耦合到(一个或多个)处理器1202中的至少一个的控制模块(芯片组)1204、被耦合到控制模块1204的存储器1206、被耦合到控制模块1204的非易失性存储器(NVM)/存储设备1208、被耦合到控制模块1204的一个或多个输入/输出设备1210，以及被耦合到控制模块1204的网络接口1212。

处理器1202可包括一个或多个单核或多核处理器，处理器1202可包括通用处理器或专用处理器(例如图形处理器、应用处理器、基频处理器等)的任意组合。在一些实施例中，装置1200能够作为本申请实施例中所述终端设备、服务器(集群)等设备。

在一些实施例中，装置1200可包括具有指令1214的一个或多个计算机可读介质(例如，存储器1206或NVM/存储设备1208)以及与该一个或多个计算机可读介质相合并被配置为执行指令1214以实现模块从而执行本公开中所述的动作的一个或多个处理器1202。

对于一个实施例，控制模块1204可包括任意适当的接口控制器，以向(一个或多个)处理器1202中的至少一个和/或与控制模块1204通信的任意适当的设备或组件提供任意适当的接口。

控制模块1204可包括存储器控制器模块，以向存储器1206提供接口。存储器控制器模块可以是硬件模块、软件模块和/或固件模块。

存储器1206可被用于例如为装置1200加载和存储数据和/或指令1214。对于一个实施例，存储器1206可包括任意适当的易失性存储器，例如，适当的DRAM。在一些实施例中，存储器1206可包括双倍数据速率类型四同步动态随机存取存储器(DDR4SDRAM)。

对于一个实施例，控制模块1204可包括一个或多个输入/输出控制器，以向NVM/存储设备1208及(一个或多个)输入/输出设备1210提供接口。

例如，NVM/存储设备1208可被用于存储数据和/或指令1214。NVM/存储设备1208可包括任意适当的非易失性存储器(例如，闪存)和/或可包括任意适当的(一个或多个)非易失性存储设备(例如，一个或多个硬盘驱动器(HDD)、一个或多个光盘(CD)驱动器和/或一个或多个数字通用光盘(DVD)驱动器)。

NVM/存储设备1208可包括在物理上作为装置1200被安装在其上的设备的一部分的存储资源，或者其可被该设备访问可不必作为该设备的一部分。例如，NVM/存储设备1208可通过网络经由(一个或多个)输入/输出设备1210进行访问。

(一个或多个)输入/输出设备1210可为装置1200提供接口以与任意其他适当的设备通信，输入/输出设备1210可以包括通信组件、音频组件、传感器组件等。网络接口1212可为装置1200提供接口以通过一个或多个网络通信，装置1200可根据一个或多个无线网络标准和/或协议中的任意标准和/或协议来与无线网络的一个或多个组件进行无线通信，例如接入基于通信标准的无线网络，如WiFi、2G、3G、4G、5G等，或它们的组合进行无线通信。

对于一个实施例，(一个或多个)处理器1202中的至少一个可与控制模块1204的一个或多个控制器(例如，存储器控制器模块)的逻辑封装在一起。对于一个实施例，(一个或多个)处理器1202中的至少一个可与控制模块1204的一个或多个控制器的逻辑封装在一起以形成系统级封装(SiP)。对于一个实施例，(一个或多个)处理器1202中的至少一个可与控制模块1204的一个或多个控制器的逻辑集成在同一模具上。对于一个实施例，(一个或多个)处理器1202中的至少一个可与控制模块1204的一个或多个控制器的逻辑集成在同一模具上以形成片上系统(SoC)。

在各个实施例中，装置1200可以但不限于是：服务器、台式计算设备或移动计算设备(例如，膝上型计算设备、手持计算设备、平板电脑、上网本等)等终端设备。在各个实施例中，装置1200可具有更多或更少的组件和/或不同的架构。例如，在一些实施例中，装置1200包括一个或多个摄像机、键盘、液晶显示器(LCD)屏幕(包括触屏显示器)、非易失性存储器端口、多个天线、图形芯片、专用集成电路(ASIC)和扬声器。

其中，检测装置中可采用主控芯片作为处理器或控制模块，传感器数据、位置信息等存储到存储器或NVM/存储设备中，传感器组可作为输入/输出设备，通信接口可包括网络接口。

对于装置实施例而言，由于其与方法实施例基本相似，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

本说明书中的各个实施例均采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似的部分互相参见即可。

本申请实施例是参照根据本申请实施例的方法、终端设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理终端设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理终端设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理终端设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理终端设备上，使得在计算机或其他可编程终端设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程终端设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

尽管已描述了本申请实施例的优选实施例，但本领域内的技术人员一旦得知了基本创造性概念，则可对这些实施例做出另外的变更和修改。所以，所附权利要求意欲解释为包括优选实施例以及落入本申请实施例范围的所有变更和修改。

最后，还需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者终端设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者终端设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者终端设备中还存在另外的相同要素。

以上对本申请所提供的一种用户意图识别方法和装置，一种物联网操作系统、一种物联网设备、一种电子设备和一种存储介质，进行了详细介绍，本文中应用了具体个例对本申请的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本申请的方法及其核心思想；同时，对于本领域的一般技术人员，依据本申请的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本申请的限制。

Claims

1.一种用户意图识别方法，其特征在于，所述方法包括：

获取待处理的用户对话数据；

获取所述聚类结果之间的交集作为目标聚类结果；

2.根据权利要求1所述的方法，其特征在于，在获取待处理的用户对话数据后，所述方法还包括：

对所述用户对话数据进行分词，得到对话分词；

对保留的所述用户对话数据进行去重处理。

3.根据权利要求1所述的方法，其特征在于，所述采用至少两种聚类算法对所述用户对话数据进行聚类，得到聚类结果，包括：

依据所述用户对话数据转换得到意图向量；

4.根据权利要求3所述的方法，其特征在于，所述依据所述用户对话数据转换得到意图向量，包括：

将所述用户对话数据转换为句向量；

采用自编码器对所述句向量进行降维处理，得到意图向量。

5.根据权利要求1所述的方法，其特征在于，所述获取所述聚类结果之间的交集作为目标聚类结果，包括：

获取所述聚类结果之间的交集；

6.根据权利要求1所述的方法，其特征在于，所述目标聚类结果包括簇结果，所述依据所述目标聚类结果进行用户意图识别，得到用户意图数据，包括：

依据所述权重总分数从所述关键字中提取出目标关键字。

7.根据权利要求6所述的方法，其特征在于，还包括：

8.根据权利要求6所述的方法，其特征在于，还包括：

按照所述簇分数在所述聚类结果中对所述簇结果进行排序；

依据排序结果从所述簇结果中确定目标簇结果。

9.根据权利要求8所述的方法，其特征在于，所述依据所述簇结果的所述目标关键字的所述权重总分数得到簇分数，包括：

10.根据权利要求8所述的方法，其特征在于，还包括：

11.根据权利要求10所述的方法，其特征在于，在所述依据排序结果，从所述簇结果中的用户对话数据中筛选出目标用户对话数据之前，所述方法还包括：

12.根据权利要求10所述的方法，其特征在于，还包括：

依据所述意图名称以及所述用户意图创建意图结构体系。

13.根据权利要求12所述的方法，其特征在于，所述意图名称包括行业和行业中的场景。

14.一种用户意图识别装置，其特征在于，所述装置包括：

用户对话数据获取模块，用于获取待处理的用户对话数据；

15.一种电子设备，其特征在于，包括：处理器；和

存储器，其上存储有可执行代码，当所述可执行代码被执行时，使得所述处理器执行如权利要求1-13中一个或多个所述的方法。

16.一个或多个机器可读介质，其上存储有可执行代码，当所述可执行代码被执行时，使得处理器执行如权利要求1-13中一个或多个所述的方法。