CN111324727A

CN111324727A - 用户意图识别方法、装置、设备和可读存储介质

Info

Publication number: CN111324727A
Application number: CN202010102579.8A
Authority: CN
Inventors: 翟周伟; 黄荣升; 徐犇; 游飞; 李宁; 贺文嵩
Original assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Current assignee: Baidu Online Network Technology Beijing Co Ltd; Shanghai Xiaodu Technology Co Ltd
Priority date: 2020-02-19
Filing date: 2020-02-19
Publication date: 2020-06-23
Anticipated expiration: 2040-02-19
Also published as: US11646016B2; JP7130194B2; US20210256969A1; JP2021131528A; CN111324727B

Abstract

本申请公开了一种用户意图识别方法、装置、设备和可读存储介质，涉及自然语言处理技术领域。具体实现方案为：获取多轮对话数据和每轮对话数据的满意度，并筛选满意度满足设定满意条件的目标对话数据；对所述目标对话数据中的输入数据标注意图标签；根据所述目标对话数据中的输入数据和所述输入数据的意图标签训练所述意图识别模型，以通过训练后的所述意图识别模型对新的输入数据进行意图识别。本申请实施例能够自动筛选海量训练样本，进而训练得到高精度意图识别模型，提高意图识别精度。

Description

用户意图识别方法、装置、设备和可读存储介质

技术领域

本申请涉及计算机技术，尤其涉及自然语言处理技术领域。

背景技术

在自然语言处理领域，意图识别是对自然语言的意图进行识别，从而基于意图识别结果提供给用户想要的信息。

在对自然语言进行意图识别时，包括以下三种方案：1)基于文法的方法。挖掘出相关上下文文法模板，以及槽位等信息，通过匹配方法进行意图识别；2)基于传统机器学习的方法，利用传统的分类算法进行意图分类；3)基于神经网络的深度学习方法。

其中，方案3)的拟合能力和泛化能力是最好的，但是需要海量样本来训练神经网络模型，保证模型的意图识别精度。因此，而如何构建有效的海量样本是一个难题。

发明内容

本申请实施例提供了一种用户意图识别方法、装置、设备和可读存储介质，以自动筛选海量训练样本，进而训练得到高精度意图识别模型，提高意图识别精度。

第一方面，本申请实施例提供了一种用户意图识别方法，包括：

获取多轮对话数据和每轮对话数据的满意度，其中，每轮对话数据包括用户的输入数据和响应数据，所述响应数据是通过意图识别模型对所述输入数据进行意图识别，并根据意图识别结果反馈的；

从所述多轮对话数据中，筛选满意度满足设定满意条件的目标对话数据；

对所述目标对话数据中的输入数据标注意图标签；

根据所述目标对话数据中的输入数据和所述输入数据的意图标签训练所述意图识别模型，以通过训练后的所述意图识别模型对新的输入数据进行意图识别。

本申请实施例中，通过获取多轮对话数据和每轮对话数据的满意度，并筛选满意度满足设定满意条件的目标对话数据，以对话数据为满意度的判断维度，有效提高输入数据的识别精度；通过满意度作为过滤条件筛选合适的输入数据，使得筛选的输入数据的意图识别结果基本是正确的结果，从而保证筛选的输入数据具备一定的精度，根据输入数据和意图标签训练意图识别模型时，能产出更高精度的模型。本实施例中，用于训练的输入数据是通过意图识别模型进行线上识别获取的，而该输入数据又返回线下训练意图识别模型，这样从线上识别到线下训练构成闭环，不断依据对话满意度从线上挖掘海量的高精度样本，驱动意图识别模型向更高精度更新；随着线上模型识别精度的不断提升，输入数据的精度也会越来越高，满意度也越来越高，从而形成良性循环，最终提高意图识别模型的识别精度。

可选的，所述根据所述目标对话数据中的输入数据和所述输入数据的意图标签训练所述意图识别模型，包括：

提取所述目标对话数据中输入数据的语言特征，以及所述输入数据关联的特征；

以所述输入数据的语言特征和所述输入数据关联的特征作为输入，以所述意图标签作为目标输出，训练所述意图识别模型；

其中，所述输入数据关联的特征包括：所述输入数据的搜索需求、所述输入数据的响应数据、所述输入数据的上下文数据和所述输入数据的统计数据中的至少一种。

上述申请中的一种可选实施方式，以输入数据的语言特征和关联的特征作为模型的输入，特征层面更准确地反映用户意图，则在特征层面进行意图识别，有利于提高识别精度；输入数据关联的特征是为更好地识别输入数据的意图而引入的特征，这些特征从侧面体现用户意图，对输入数据的意图识别起到良好的辅助作用。

可选的，在所述根据所述目标对话数据中的输入数据和所述输入数据的意图标签训练所述意图识别模型之前，还包括：

获取所述目标对话数据中输入数据的来源终端类型；

所述根据所述目标对话数据中的输入数据和所述输入数据的意图标签训练所述意图识别模型，包括：

按照所述来源终端类型，对所述目标对话数据中的输入数据进行分组，得到多组输入数据；

根据每组输入数据和每组输入数据的意图标签，训练与每组输入数据的来源终端类型相对应的意图识别模型；

其中，所述来源终端类型包括有屏终端类型和无屏终端类型。

上述申请中的一种可选实施方式，通过根据有屏终端类型和无屏终端类型将输入数据分组，并分组训练与来源终端类型对应的意图识别模型，从而得到分别适用于有屏终端和无屏终端的意图识别模型，同时提高有屏终端和无屏终端的意图识别精度。

可选的，所述获取多轮对话数据和每轮对话数据的满意度，包括：

按照设定周期拉取最近时段的满意度反馈日志，所述满意度反馈日志包括多轮对话数据和每轮对话数据的满意度；

按照所述设定周期，根据所述目标对话数据中的输入数据和所述输入数据的意图标签训练所述意图识别模型。

上述申请中的一种可选实施方式，满意度反馈日志会自动收集用户的对话数据和满意度，以满意度反馈日志作为数据源，可以较方便、快捷地获取对话数据以及对话数据的满意度，不需要额外编程；通过设定周期拉取最近时段的满意度反馈日志，并按照设定周期训练意图识别模型，从而按照设定周期自动进行模型训练；同时，保证模型能够随着线上新的输入数据及时更新。

可选的，在所述按照设定周期拉取最近时段的满意度反馈日志，所述满意度反馈日志包括多轮对话数据和每轮对话数据的满意度之前，还包括：

从用户行为日志中获取所述多轮对话数据；

采用满意度打分模型，对所述多轮对话数据中的每轮对话数据进行满意度打分，得到每轮对话数据的满意度分数；

将所述多轮对话数据和每轮对话数据的满意度分数存储到所述满意度反馈日志中。

上述申请中的一种可选实施方式，用户行为日志会自动收集用户的对话数据，以用户行为日志作为数据源，可以较方便、快捷地获取对话数据，不需要额外编程；通过满意度打分模型得到对话数据的满意度分数，具体化了满意度的获取方法；而且，通过满意度打分模型可以客观、按照统一标准进行满意度打分，提高满意度分数的真实性；在对话数据量较大的情况下，采用满意度打分模型能够快速准确地获取满意度分数。

可选的，所述从用户行为日志中获取多轮对话数据，包括：

通过用户行为日志，收集多轮候选对话数据，其中，每轮候选对话数据包括用户的输入数据和响应数据，所述响应数据是通过意图识别模型对所述输入数据进行意图识别，并根据意图识别结果反馈的；

根据所述意图识别模型，获取每轮候选对话数据中输入数据的意图置信度；

从所述用户行为日志中，筛选意图置信度满足设定置信度条件的输入数据和所述输入数据的响应数据，构成所述多轮对话数据。

上述申请中的一种可选实施方式，用户行为日志会收集很多候选对话数据，这些候选对话数据中输入数据的意图置信度有高有低，意图置信度越高说明输入数据为该意图的概率越高，识别精度越高。因此，通过置信度条件将意图置信度高的输入数据筛选出来，即将识别精度高的输入数据筛选出来。这样，筛选出的输入数据作为反馈数据进行模型训练时，能够进一步提高模型的意图识别精度。

可选的，所述对所述目标对话数据中的输入数据标注意图标签，包括：

获取所述目标对话数据中响应数据的类目信息和指令信息；

根据所述类目信息和指令信息，以及意图标签与类目信息和指令信息的映射关系，确定所述目标对话数据中所述输入数据的意图标签；

对所述目标对话数据中的输入数据标注所述意图标签。

上述申请中的一种可选实施方式，考虑到实际应用中意图识别模型的意图标签比较多，而并不是所有的意图均可以采用输入数据进行训练，则设置意图标签与类目信息和指令信息的对应关系，以灵活选择可以采用输入数据进行训练的意图标签，有选择地提高部分意图的识别精度，同时不影响其他意图的识别精度。而且，通过意图标签映射的方式进行自动标注，无需人工参与，提高了标注的效率和准确性。

第二方面，本申请实施例还提供了一种用户意图识别装置，包括：

获取模块，用于获取多轮对话数据和每轮对话数据的满意度，其中，每轮对话数据包括用户的输入数据和响应数据，所述响应数据是通过意图识别模型对所述输入数据进行意图识别，并根据意图识别结果反馈的；

筛选模块，用于从所述多轮对话数据中，筛选满意度满足设定满意条件的目标对话数据；

标注模块，用于对所述目标对话数据中的输入数据标注意图标签；

训练模块，用于根据所述目标对话数据中的输入数据和所述输入数据的意图标签训练所述意图识别模型，以通过训练后的所述意图识别模型对新的输入数据进行意图识别。

第三方面，本申请实施例还提供了一种电子设备，包括：

至少一个处理器；以及

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行如第一方面实施例所提供的一种用户意图识别方法。

第四方面，本申请实施例还提供了一种存储有计算机指令的非瞬时计算机可读存储介质，所述计算机指令用于使所述计算机执行如第一方面实施例所提供的一种用户意图识别方法。

上述可选方式所具有的其他效果将在下文中结合具体实施例加以说明。

附图说明

附图用于更好地理解本方案，不构成对本申请的限定。其中：

图1是本申请实施例一中的一种用户意图识别方法的流程图；

图2是本申请实施例二中的一种用户意图识别方法的流程图；

图3是本申请实施例三中的一种用户意图识别方法的流程图；

图4是本申请实施例四中的一种用户意图识别方法的流程图；

图5是本申请实施例五中的一种用户意图识别装置的结构图；

图6是用来实现本申请实施例的用户意图识别方法的电子设备的框图。

具体实施方式

以下结合附图对本申请的示范性实施例做出说明，其中包括本申请实施例的各种细节以助于理解，应当将它们认为仅仅是示范性的。因此，本领域普通技术人员应当认识到，可以对这里描述的实施例做出各种改变和修改，而不会背离本申请的范围和精神。同样，为了清楚和简明，以下的描述中省略了对公知功能和结构的描述。

实施例一

图1是本申请实施例一中的一种用户意图识别方法的流程图，本申请实施例适用于采用意图识别模型对用户的输入数据进行意图识别的情况，该方法通过用户意图识别装置执行，该装置采用软件和/或硬件实现，并具体配置于具备一定数据运算能力的电子设备中。

如图1所示的一种用户意图识别方法，包括：

S101、获取多轮对话数据和每轮对话数据的满意度。

本实施例中，对话数据指用户与对话式智能终端(以下简称终端)之间的线上对话数据，或称为交互数据。其中，对话式智能终端包括智能音箱、智能电视等，与本实施例中的电子设备通信连接。一轮对话数据包括用户的输入数据和响应数据，输入数据可以是语音格式的数据或者文本格式的数据，响应数据是通过意图识别模型对输入数据进行意图识别，并根据意图识别结果反馈的。

其中，意图识别模型可以是多分类的神经网络模型，例如卷积神经网络模型与多分类模型构成的模型，或者循环神经网络模型与多分类模型构成的模型。可选的，意图识别模型可以同时配置在终端和电子设备中，并使终端和电子设备中的意图识别模型保持同步。

多轮对话数据是按照时间先后顺序产生的、连续的对话数据。一般情况下，上下轮对话数据处于一个对话场景中，讨论某一个主题。示例性的，第一轮对话数据中，用户说：儿童歌曲；终端采用意图识别模型对“儿童歌曲”进行意图识别得到意图识别结果，并根据意图识别结果反馈：你想哪一首儿童歌曲。第二轮对话数据中，用户说：任一首儿童歌曲；终端继续采用意图识别模型对“任一首儿童歌曲”进行意图识别得到意图识别结果，并根据意图识别结果执行儿童歌曲的播放操作，并反馈与儿童歌曲的播放操作对应的数据。

对话数据的满意度指用户对对话数据的满意度。示例性的，如果用户反复说同一句话，终端给出了不同的响应数据或者给出没有内容的响应数据，该对话数据的满意度低；如果用户对上轮响应数据回复肯定语义的话，如“是的”、“好”，该对话数据的满意度高。显然，满意度反映了意图识别的准确性。

S102、从多轮对话数据中，筛选满意度满足设定满意条件的目标对话数据。

如果对话数据的满意度满足设定满意条件，则该对话数据是用户满意的，该对话数据中的意图识别是准确的。可选的，如果满意度用等级表示，则设定满意条件可以是满意度高于设定等级；如果满意度用分数表示，则设定满意条件可以是满意度分数大于设定阈值。为了方便描述和区分，将满意度满足设定满意条件的对话数据称为目标对话数据。

可选的，对话数据的满意度可以由用户进行在线评价或者采用满意度打分模型进行离线评价。其中，由用户进行在线评价可以包括，在一轮对话结束后由用户输入满意或者不满意。

S103、对目标对话数据中的输入数据标注意图标签。

在一可选实施方式中，直接将输入数据的意图识别结果标注为意图标签。

在另一可选实施方式中，考虑到输入数据的意图识别结果可能存在少量错误的情况，人工对输入数据标注意图标签。

S104、根据目标对话数据中的输入数据和输入数据的意图标签训练意图识别模型，以通过训练后的意图识别模型对新的输入数据进行意图识别。

本实施例中，将根据满意度筛选出的输入数据作为训练样本，对意图识别模型进行训练，从而利用对话满意度来自动化挖掘海量样本，进而训练意图识别模型。

由于目标对话数据中的输入数据是识别精度较高的数据，即输入数据的意图识别结果基本是正确的结果，从而根据输入数据和意图标签训练意图识别模型时，能产出更高精度的模型。

本实施例根据从线上获取的输入数据和输入数据的意图标签在线下训练意图识别模型，将训练后的意图识别模型更新到终端中，以使终端采用意图识别模型继续对新的输入数据进行线上意图识别，形成满意度驱动下的意图识别方法的闭环。

本申请实施例中，通过获取多轮对话数据和每轮对话数据的满意度，并筛选满意度满足设定满意条件的目标对话数据，以对话数据为满意度的判断维度，有效提高输入数据的识别精度；通过满意度作为过滤条件筛选合适的输入数据，使得根据输入数据和意图标签训练意图识别模型时，能产出更高精度的模型。本实施例中，用于训练的输入数据是通过意图识别模型进行线上识别获取的，而该输入数据又返回线下训练意图识别模型，这样从线上识别到线下训练构成闭环，不断依据对话满意度挖掘海量的高精度样本，驱动意图识别模型向更高精度更新；随着模型识别精度的不断提升，输入数据的精度也会越来越高，满意度也越来越高，从而形成良性循环，最终提高意图识别模型的识别精度。

实施例二

图2是本申请实施例二中的一种用户意图识别方法的流程图，本申请实施例在上述各实施例的技术方案的基础上进行了优化改进。

进一步的，将操作“根据目标对话数据中的输入数据和输入数据的意图标签训练意图识别模型”细化为“提取目标对话数据中输入数据的语言特征，以及输入数据关联的特征；以输入数据的语言特征和输入数据关联的特征作为输入，以意图标签作为目标输出，训练意图识别模型；其中，输入数据关联的特征包括：输入数据的搜索需求、输入数据的响应数据、输入数据的上下文数据和输入数据的统计数据中的至少一种”，在特征层面进行意图识别。

如图2所示的一种用户意图识别方法，包括：

S201、获取多轮对话数据和每轮对话数据的满意度。

其中，每轮对话数据包括用户的输入数据和响应数据，响应数据是通过意图识别模型对输入数据进行意图识别，并根据意图识别结果反馈的。

S202、从多轮对话数据中，筛选满意度满足设定满意条件的目标对话数据。

S203、对目标对话数据中的输入数据标注意图标签。

S204、提取目标对话数据中输入数据的语言特征，以及输入数据关联的特征。

可选的，如果输入数据是语音格式的数据，需要对输入数据进行语音识别，得到文本格式的数据。如果输入数据是文本格式的数据，则无需进行额外处理。提取目标对话数据中输入数据的语言特征包括：提取目标对话数据中，文本格式的输入数据的词法、句法和语义等语言特征。

其中，输入数据关联的特征包括：输入数据的搜索需求、输入数据的响应数据、输入数据的上下文数据和输入数据的统计数据中的至少一种。

输入数据的搜索需求为将输入数据作为搜索词时的内容需求，例如，以输入数据为搜索词得到网络搜索结果，从网络搜索结果中选取排在首位的结果作为搜索需求。在实际应用场景中，通过网络搜索的方式获取搜索需求的耗时较长，为了减少耗时，预先构建用户可能输入的输入数据，并预先对构建的输入数据通过网络搜索的方式获取搜索需求，将构建的输入数据和搜索需求写入词典中。在获取到目标对话数据中的输入数据后，根据输入数据在词典中查询得到搜索需求。

输入数据的响应数据包括类目信息和指令信息，其中，类目信息包括垂类信息和细分类信息。例如，垂类信息为音乐，音乐的细分类信息为音乐控制，指令信息为停止播放，则类目信息和指令信息共同构成的响应数据为：停止播放当前音乐。

输入数据的上下文数据能够反映输入数据的语境，包括输入数据的历史输入数据和后续输入数据。历史输入数据和后续输入数据可以从前轮和后轮对话数据中获取。可以理解的是，输入数据与其上下文数据应来自于同一用户。

输入数据的统计数据包括输入数据在预设时长内的出现频次、输入数据的长度和输入数据的语言模型等。

S205、以输入数据的语言特征和输入数据关联的特征作为输入，以意图标签作为目标输出，训练意图识别模型，以通过训练后的意图识别模型对新的输入数据进行意图识别。

值得说明的是，意图识别模型在识别时和训练时，输入至模型的特征应是对齐的。也就是，意图识别模型在训练时，如果以输入数据的语言特征和输入数据关联的特征作为输入，则意图识别模型在识别时，也应以输入数据的语言特征和输入数据关联的特征作为输入。基于此，意图识别模型在识别之前，需要提取用户的当前输入数据的语言特征和当前输入数据关联的特征。在当前输入数据关联的特征中，当前输入数据的响应数据可以是前一轮对话数据中的响应数据。这是因为上下轮对话数据的主题基本是一致的，前一轮对话数据中的响应数据也能辅助识别当前输入数据的意图。输入数据的上下文数据仅包括当前输入数据的历史输入数据，即上文数据。

本实施例中，以输入数据的语言特征和关联的特征作为模型的输入，特征层面更准确地反映用户意图，则在特征层面进行意图识别，有利于提高识别精度；输入数据关联的特征是为更好地识别输入数据的意图而引入的特征，这些特征从侧面体现用户意图，对输入数据的意图识别起到良好的辅助作用。

实施例三

图3是本申请实施例三中的一种用户意图识别方法的流程图，本申请实施例在上述各实施例的技术方案的基础上进行了优化改进。

进一步的，在操作“根据目标对话数据中的输入数据和输入数据的意图标签训练意图识别模型”之前，追加操作“获取目标对话数据中输入数据的来源终端类型”，相应的，将操作“根据目标对话数据中的输入数据和输入数据的意图标签训练意图识别模型”细化为“按照来源终端类型，对目标对话数据中的输入数据进行分组，得到多组输入数据；根据每组输入数据和每组输入数据的意图标签，训练与每组输入数据的来源终端类型相对应的意图识别模型；其中，来源终端类型包括有屏终端类型和无屏终端类型”，从而得到分别适用于有屏终端和无屏终端的意图识别模型。

如图3所示的一种用户意图识别方法，包括：

S301、获取多轮对话数据和每轮对话数据的满意度。

S302、从多轮对话数据中，筛选满意度满足设定满意条件的目标对话数据。

S303、对目标对话数据中的输入数据标注意图标签。

S304、获取目标对话数据中输入数据的来源终端类型。

本实施例中，来源终端，即对话式智能终端的类型主要包括有屏终端类型和无屏终端类型。有屏终端包括智能电视和带屏音箱等，无屏终端包括无屏音箱等。

可选的，获取目标对话数据中输入数据的来源终端信息，例如来源终端名称、来源终端是否是智能电视、带屏音箱或者无屏音箱。预先设置来源终端信息与来源终端类型的映射关系，并根据该映射关系，确定目标对话数据中输入数据的来源终端信息映射的来源终端类型。

在有些应用场景中，用于对话的无屏终端连接到带屏幕的对端终端上，此时的无屏终端应视为有屏终端。基于此，来源终端信息还应包括来源终端连接的对端终端的终端类型，如果对端终端是有屏终端类型，则来源终端信息映射的来源终端类型是有屏终端类型；如果对端终端是无屏终端类型，则来源终端信息映射的来源终端类型是无屏终端类型。

S305、按照来源终端类型，对目标对话数据中的输入数据进行分组，得到多组输入数据。

本实施例中，每轮对话数据均携带输入数据的来源终端类型，基于此，将来源终端类型相同的输入数据分为一组。具体将属于有屏终端类型的输入数据分为一组，将属于无屏终端类型的输入数据分为另一组。

S306、根据每组输入数据和每组输入数据的意图标签，训练与每组输入数据的来源终端类型相对应的意图识别模型，以通过训练后的意图识别模型对新的输入数据进行意图识别。

一般情况下，有屏终端可以通过屏幕显示一些信息以引导用户输入数据；而且，有屏终端能够提供无屏终端不具备的视频播放和图文显示功能，因此有屏终端与无屏终端的响应数据不尽相同。基于上述分析，有必要训练分别适用于有屏终端和无屏终端的意图识别模型，即分别训练与有屏终端类型对应的意图识别模型和与无屏终端类型对应的意图识别模型。

可选的，与有屏终端类型对应的意图识别模型和与无屏终端类型对应的意图识别模型的结构可以相同也可以不同。具体的，根据属于有屏终端类型的输入数据和该输入数据的意图标签，训练与有屏终端类型对应的意图识别模型，根据属于无屏终端类型的输入数据和该输入数据的意图标签，训练与无屏终端类型对应的意图识别模型。

本申请实施例通过根据有屏终端类型和无屏终端类型将输入数据分组，并分组训练与来源终端类型对应的意图识别模型，从而得到分别适用于有屏终端和无屏终端的意图识别模型，同时提高有屏终端和无屏终端的意图识别精度。

实施例四

图4是本申请实施例四中的一种用户意图识别方法的流程图，本申请实施例在上述各实施例的技术方案的基础上进行了优化改进。

进一步的，将操作“获取多轮对话数据和每轮对话数据的满意度”细化为“按照设定周期拉取最近时段的满意度反馈日志，满意度反馈日志包括多轮对话数据和每轮对话数据的满意度”，相应的，将操作“根据目标对话数据中的输入数据和输入数据的意图标签训练意图识别模型”细化为“按照设定周期，根据目标对话数据中的输入数据和输入数据的意图标签训练意图识别模型”，从而周期性自动训练意图识别模型。

进一步的，将操作“对目标对话数据中的输入数据标注意图标签”细化为“获取目标对话数据中响应数据的类目信息和指令信息；根据类目信息和指令信息，以及意图标签与类目信息和指令信息的映射关系，确定目标对话数据中输入数据的意图标签；对目标对话数据中的输入数据标注意图标签”，以灵活选择可以采用输入数据进行训练的意图标签。

如图4所示的一种用户意图识别方法，包括：

S401、按照设定周期拉取最近时段的满意度反馈日志，满意度反馈日志包括多轮对话数据和每轮对话数据的满意度。

设定周期是自定义的周期，例如一周。最近时段是以当前时刻为截止时刻往前推设定时长得到的时段，例如当前是2月1日，设定时长是一个月，则最近时段是1月1日至2月1日。

满意度反馈日志会随时间的进行自动收集对话数据以及对话数据的满意度。最近时段的满意度反馈日志包括最近时段收集到的多轮对话数据以及每轮对话数据的满意度。

可选的，在S401之前还包括满意度反馈日志的生成过程：第一步，从用户行为日志中获取多轮对话数据；第二步，采用满意度打分模型，对多轮对话数据中的每轮对话数据进行满意度打分，得到每轮对话数据的满意度分数；第三步，将多轮对话数据和每轮对话数据的满意度分数存储到满意度反馈日志中。

在第一步中，通过用户行为日志收集多轮候选对话数据，其中，每轮候选对话数据包括用户的输入数据和响应数据，响应数据是通过意图识别模型对输入数据进行意图识别，并根据意图识别结果反馈的；根据意图识别模型，获取每轮候选对话数据中输入数据的意图置信度；从用户行为日志中，筛选意图置信度满足设定置信度条件的输入数据和输入数据的响应数据，构成多轮对话数据。其中，用户行为日志可以在通过意图识别模型进行线上识别的过程中，不断收集用户与对话式智能终端间的对话数据，称为候选对话数据。每轮候选对话数据中的输入数据均会采用意图识别模型进行意图识别，得到意图识别结果和意图置信度。这些候选对话数据中输入数据的意图置信度有高有低，意图置信度越高说明输入数据为该意图的概率越高，识别精度越高。设定置信度条件可以是意图置信度大于置信度阈值，或者按照意图置信度从高到低排序时，排序位置为前预设数量个，例如前5个。因此，通过置信度条件将意图置信度高的输入数据筛选出来，即将识别精度高的输入数据筛选出来，使得筛选出的输入数据作为反馈数据进行模型训练时，能够进一步提高模型的意图识别精度。

在第二步中，为了提高满意度评价效率，采用满意度打分模型进行离线评价。具体将每轮对话数据对应的响应时间、播放时长、响应的内容和用户意图的相关性等输入至满意度打分模型，得到满意度打分模型输出的满意度分数。

在第三步中，每当用户行为日志收集到新一轮对话数据后，采用满意度打分模型对新一轮对话数据进行满意度打分，得到新一轮对话数据的满意度分数。将新一轮对话数据和其满意度分数存储到满意度反馈日志中。这样，随着用户行为日志不断自动收集用户的对话数据，从而满意度反馈日志也自动收集到用户的对话数据和满意度。

S402、从多轮对话数据中，筛选满意度满足设定满意条件的目标对话数据。

可选的，从多轮对话数据中，筛选满意度分数大于设定阈值的目标对话数据。通过筛选满意度分数大于设定阈值的目标对话数据，筛选出识别精度高的输入数据，进一步在根据输入数据和意图标签训练意图识别模型时，能产出更高精度的模型。

S403、获取目标对话数据中响应数据的类目信息和指令信息。

可选的，从满意度反馈日志中获取目标对话数据中响应数据的类目信息和指令信息。

值得说明的是，满意度反馈日志以字段格式存储信息，具体存储有多轮对话数据(query)、每轮对话数据的满意度(qs)、终端标识或用户标识(cuid)、时间(time)、终端类型或终端信息(device_type)、垂类信息(bot)、细分类信息(domain)和指令信息(intent)。

其中，cuid用于区分不同用户的输入数据。如果cuid是终端标识，则需将与该终端对话的所有用户看做一个用户。device_type用于获取输入数据的来源终端类型，以得到分别适用于有屏终端和无屏终端的意图识别模型，详见实施例三的描述。

S404、根据类目信息和指令信息，以及意图标签与类目信息和指令信息的映射关系，确定目标对话数据中输入数据的意图标签。

考虑到实际应用中意图识别模型的意图标签比较多，可达到上千个；而并不是所有的意图都可以采用输入数据进行训练。这是因为，要想成功识别出某个意图，需要大量的样本支撑，而用户的输入数据具有不定性，导致有些意图训练所需的样本数量不足。因此，有必要选择可以采用输入数据进行训练的意图标签。可选地，统计意图识别模型在线上识别过程中，识别出每个意图标签的占比，并结合在线应用过程中每个意图标签对应的数据流量，选择数据流量及意图标签占比超过设定值的垂类意图标签，设定值可以是40％。在一应用场景中，最终选择了30多个意图标签。

预先建立数据流量及意图标签占比超过设定值的垂类意图标签与类目信息和指令信息的映射关系。目标对话数据的响应数据中，未建立映射关系的类目信息和指令信息统一映射到“其它”意图标签。最终，意图标签不同的输入数据互为负样本。

S405、对目标对话数据中的输入数据标注意图标签。

S406、按照设定周期，根据目标对话数据中的输入数据和输入数据的意图标签训练意图识别模型，以通过训练后的意图识别模型对新的输入数据进行意图识别。

本实施例中，满意度反馈日志会自动收集用户的对话数据和满意度，以满意度反馈日志作为数据源，可以较方便、快捷地获取对话数据以及对话数据的满意度，不需要额外编程；通过设定周期拉取最近时段的满意度反馈日志，并按照设定周期训练意图识别模型，从而按照设定周期自动进行模型训练；同时，保证模型能够随着线上新的输入数据及时更新。

进一步的，用户行为日志会自动收集用户的对话数据，以用户行为日志作为数据源，可以较方便、快捷地获取对话数据，不需要额外编程；通过满意度打分模型得到对话数据的满意度分数，具体化了满意度的获取方法；而且，通过满意度打分模型可以客观、按照统一标准进行满意度打分，提高满意度分数的真实性；在对话数据量较大的情况下，采用满意度打分模型能够快速准确地得到满意度分数。

进一步的，通过设置意图标签与类目信息和指令信息的对应关系，以灵活选择可以采用输入数据进行训练的意图标签，有选择地提高部分意图的识别精度，同时不影响其他意图的识别精度。而且，通过意图标签映射的方式进行自动标注，无需人工参与，提高了标注的效率和准确性。

实施例五

图5是本申请实施例五中的一种用户意图识别装置的结构图，本申请实施例适用于采用意图识别模型对用户的输入数据进行意图识别的情况，该装置采用软件和/或硬件实现，并具体配置于具备一定数据运算能力的电子设备中。

如图5所示的一种用户意图识别装置500，包括：获取模块501，筛选模块502，标注模块503和训练模块504；其中，

获取模块501，用于获取多轮对话数据和每轮对话数据的满意度，其中，每轮对话数据包括用户的输入数据和响应数据，响应数据是通过意图识别模型对输入数据进行意图识别，并根据意图识别结果反馈的；

筛选模块502，用于从多轮对话数据中，筛选满意度满足设定满意条件的目标对话数据；

标注模块503，用于对目标对话数据中的输入数据标注意图标签；

训练模块504，用于根据目标对话数据中的输入数据和输入数据的意图标签训练意图识别模型，以通过训练后的意图识别模型对新的输入数据进行意图识别。

进一步的，训练模块504具体用于提取目标对话数据中输入数据的语言特征，以及输入数据关联的特征；以输入数据的语言特征和输入数据关联的特征作为输入，以意图标签作为目标输出，训练意图识别模型；其中，输入数据关联的特征包括：输入数据的搜索需求、输入数据的响应数据、输入数据的上下文数据和输入数据的统计数据中的至少一种。

进一步的，该装置还包括来源终端类型获取模块，用于获取目标对话数据中输入数据的来源终端类型；训练模块504具体用于按照来源终端类型，对目标对话数据中的输入数据进行分组，得到多组输入数据；根据每组输入数据和每组输入数据的意图标签，训练与每组输入数据的来源终端类型相对应的意图识别模型；其中，来源终端类型包括有屏终端类型和无屏终端类型。

进一步的，获取模块501具体用于：按照设定周期拉取最近时段的满意度反馈日志，满意度反馈日志包括多轮对话数据和每轮对话数据的满意度；根据目标对话数据中的输入数据和输入数据的意图标签训练意图识别模型，包括：按照设定周期，根据目标对话数据中的输入数据和输入数据的意图标签训练意图识别模型。

进一步的，该装置还包括存储模块，用于从用户行为日志中获取多轮对话数据；采用满意度打分模型，对多轮对话数据中的每轮对话数据进行满意度打分，得到每轮对话数据的满意度分数；将多轮对话数据和每轮对话数据的满意度分数存储到满意度反馈日志中。

进一步的，存储模块在从用户行为日志中获取多轮对话数据时，具体用于：通过用户行为日志，收集在线应用过程中的多轮候选对话数据，其中，每轮候选对话数据包括用户的输入数据和响应数据，响应数据是通过意图识别模型对输入数据进行意图识别，并根据意图识别结果反馈的；根据意图识别模型，获取每轮候选对话数据中输入数据的意图置信度；从用户行为日志中，筛选意图置信度满足设定置信度条件的输入数据和输入数据的响应数据，构成多轮对话数据。

进一步的，标注模块503具体用于：获取目标对话数据中响应数据的类目信息和指令信息；根据类目信息和指令信息，以及意图标签与类目信息和指令信息的映射关系，确定目标对话数据中输入数据的意图标签；对目标对话数据中的输入数据标注意图标签。

上述用户意图识别装置可执行本申请任意实施例所提供的用户意图识别方法，具备执行用户意图识别方法相应的功能模块和有益效果。

实施例六

根据本申请的实施例，本申请还提供了一种电子设备和一种可读存储介质。

如图6所示，是实现本申请实施例的用户意图识别方法的电子设备的框图。电子设备旨在表示各种形式的数字计算机，诸如，膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置，诸如，个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例，并且不意在限制本文中描述的和/或者要求的本申请的实现。

如图6所示，该电子设备包括：一个或多个处理器601、存储器602，以及用于连接各部件的接口，包括高速接口和低速接口。各个部件利用不同的总线互相连接，并且可以被安装在公共主板上或者根据需要以其它方式安装。处理器可以对在电子设备内执行的指令进行处理，包括存储在存储器中或者存储器上以在外部输入/输出装置(诸如，耦合至接口的显示设备)上显示GUI的图形信息的指令。在其它实施方式中，若需要，可以将多个处理器和/或多条总线与多个存储器和多个存储器一起使用。同样，可以连接多个电子设备，各个设备提供部分必要的操作(例如，作为服务器阵列、一组刀片式服务器、或者多处理器系统)。图6中以一个处理器601为例。

存储器602即为本申请所提供的非瞬时计算机可读存储介质。其中，所述存储器存储有可由至少一个处理器执行的指令，以使所述至少一个处理器执行本申请所提供的用户意图识别方法。本申请的非瞬时计算机可读存储介质存储计算机指令，该计算机指令用于使计算机执行本申请所提供的用户意图识别方法。

存储器602作为一种非瞬时计算机可读存储介质，可用于存储非瞬时软件程序、非瞬时计算机可执行程序以及模块，如本申请实施例中的用户意图识别的方法对应的程序指令/模块(例如，附图5所示的包括获取模块501，筛选模块502，标注模块503和训练模块504)。处理器601通过运行存储在存储器602中的非瞬时软件程序、指令以及模块，从而执行服务器的各种功能应用以及数据处理，即实现上述方法实施例中的用户意图识别的方法。

存储器602可以包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需要的应用程序；存储数据区可存储实现用户意图识别方法的电子设备的使用所创建的数据等。此外，存储器602可以包括高速随机存取存储器，还可以包括非瞬时存储器，例如至少一个磁盘存储器件、闪存器件、或其他非瞬时固态存储器件。在一些实施例中，存储器602可选包括相对于处理器601远程设置的存储器，这些远程存储器可以通过网络连接至执行用户意图识别方法的电子设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

执行用户意图识别方法的电子设备还可以包括：输入装置603和输出装置604。处理器601、存储器602、输入装置603和输出装置604可以通过总线或者其他方式连接，图6中以通过总线连接为例。

输入装置603可接收输入的数字或字符信息，以及产生与执行用户意图识别方法的电子设备的用户设置以及功能控制有关的键信号输入，例如触摸屏、小键盘、鼠标、轨迹板、触摸板、指示杆、一个或者多个鼠标按钮、轨迹球、操纵杆等输入装置。输出装置604可以包括显示设备、辅助照明装置(例如，LED)和触觉反馈装置(例如，振动电机)等。该显示设备可以包括但不限于，液晶显示器(LCD)、发光二极管(LED)显示器和等离子体显示器。在一些实施方式中，显示设备可以是触摸屏。

此处描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、专用ASIC(专用集成电路)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括：实施在一个或者多个计算机程序中，该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释，该可编程处理器可以是专用或者通用可编程处理器，可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令，并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。

这些计算程序(也称作程序、软件、软件应用、或者代码)包括可编程处理器的机器指令，并且可以利用高级过程和/或面向对象的编程语言、和/或汇编/机器语言来实施这些计算程序。如本文使用的，术语“机器可读介质”和“计算机可读介质”指的是用于将机器指令和/或数据提供给可编程处理器的任何计算机程序产品、设备、和/或装置(例如，磁盘、光盘、存储器、可编程逻辑装置(PLD))，包括，接收作为机器可读信号的机器指令的机器可读介质。术语“机器可读信号”指的是用于将机器指令和/或数据提供给可编程处理器的任何信号。

为了提供与用户的交互，可以在计算机上实施此处描述的系统和技术，该计算机具有：用于向用户显示信息的显示装置(例如，CRT(阴极射线管)或者LCD(液晶显示器)监视器)；以及键盘和指向装置(例如，鼠标或者轨迹球)，用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互；例如，提供给用户的反馈可以是任何形式的传感反馈(例如，视觉反馈、听觉反馈、或者触觉反馈)；并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。

可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如，作为数据服务器)、或者包括中间件部件的计算系统(例如，应用服务器)、或者包括前端部件的计算系统(例如，具有图形用户界面或者网络浏览器的用户计算机，用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如，通信网络)来将系统的部件相互连接。通信网络的示例包括：局域网(LAN)、广域网(WAN)、互联网和区块链网络。

计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。

应该理解，可以使用上面所示的各种形式的流程，重新排序、增加或删除步骤。例如，本发申请中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行，只要能够实现本申请公开的技术方案所期望的结果，本文在此不进行限制。

上述具体实施方式，并不构成对本申请保护范围的限制。本领域技术人员应该明白的是，根据设计要求和其他因素，可以进行各种修改、组合、子组合和替代。任何在本申请的精神和原则之内所作的修改、等同替换和改进等，均应包含在本申请保护范围之内。

Claims

1.一种用户意图识别方法，其特征在于，包括：

对所述目标对话数据中的输入数据标注意图标签；

根据所述目标对话数据中的输入数据和所述输入数据的意图标签训练所述意图识别模型，以通过训练后的意图识别模型对新的输入数据进行意图识别。

2.根据权利要求1所述的方法，其特征在于，所述根据所述目标对话数据中的输入数据和所述输入数据的意图标签训练所述意图识别模型，包括：

3.根据权利要求1所述的方法，其特征在于，在所述根据所述目标对话数据中的输入数据和所述输入数据的意图标签训练所述意图识别模型之前，还包括：

获取所述目标对话数据中输入数据的来源终端类型；

4.根据权利要求1所述的方法，其特征在于，所述获取多轮对话数据和每轮对话数据的满意度，包括：

5.根据权利要求4所述的方法，其特征在于，在所述按照设定周期拉取最近时段的满意度反馈日志，所述满意度反馈日志包括多轮对话数据和每轮对话数据的满意度之前，还包括：

从用户行为日志中获取所述多轮对话数据；

6.根据权利要求5所述的方法，其特征在于，所述从用户行为日志中获取多轮对话数据，包括：

通过用户行为日志收集多轮候选对话数据，其中，每轮候选对话数据包括用户的输入数据和响应数据，所述响应数据是通过意图识别模型对所述输入数据进行意图识别，并根据意图识别结果反馈的；

7.根据权利要求1-6任一项所述的方法，其特征在于，所述对所述目标对话数据中的输入数据标注意图标签，包括：

获取所述目标对话数据中响应数据的类目信息和指令信息；

对所述目标对话数据中的输入数据标注所述意图标签。

8.一种用户意图识别装置，其特征在于，包括：

训练模块，用于根据所述目标对话数据中的输入数据和所述输入数据的意图标签训练所述意图识别模型，以通过训练后的意图识别模型对新的输入数据进行意图识别。

9.一种电子设备，其特征在于，包括：

至少一个处理器；以及

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行权利要求1-7中任一项所述的一种用户意图识别方法。

10.一种存储有计算机指令的非瞬时计算机可读存储介质，其特征在于，所述计算机指令用于使所述计算机执行权利要求1-7中任一项所述的一种用户意图识别方法。