CN115033676A

CN115033676A - 一种意图识别模型训练及用户意图识别方法及装置

Info

Publication number: CN115033676A
Application number: CN202210713723.0A
Authority: CN
Inventors: 应缜哲; 王昊天; 王维强
Original assignee: Alipay Hangzhou Information Technology Co Ltd
Current assignee: Alipay Hangzhou Information Technology Co Ltd
Priority date: 2022-06-22
Filing date: 2022-06-22
Publication date: 2022-09-09
Anticipated expiration: 2042-06-22
Also published as: CN115033676B; WO2023246393A1

Abstract

本说明书公开了一种意图识别模型训练及用户意图识别方法及装置，先确定包含多轮对话的历史对话数据作为训练样本，通过第一意图识别模型确定每个训练样本各轮对话的用户意图，并基于用户执行的与该训练样本对应的业务确定反馈意图，然后根据该训练样本的用户意图以及反馈意图确定第一风险识别结果，并通过第二意图识别模型确定该训练样本的各预测意图以及第二风险识别结果，最后以各训练样本第一风险识别结果与第二风险识别结果之间的差异最小为优化目标对第二意图识别模型进行训练。通过结合反馈意图以及由第一意图识别模型确定的用户意图，得到准确的风险识别结果，以对第二意图识别模型进行训练，提高了第二意图识别模型的风险识别能力。

Description

一种意图识别模型训练及用户意图识别方法及装置

技术领域

本申请涉及计算机技术领域，尤其涉及一种意图识别模型训练及用户意图识别方法及装置。

背景技术

目前，随着互联网的快速发展，交互式风控技术也在不断发展，在交互式风控的应用场景中，业务平台可以通过外呼的方式实现与用户的双向沟通，从而及时发现用户的行为风险，对用户进行行为劝阻或风险提示。因此，能否及时准确地发现用户的行为风险是需要重点考虑的问题。

本说明书提供一种意图识别模型的训练及基于模型的用户意图识别方法，以及时发现用户的行为风险，提高风控的时效性和准确度。

发明内容

本说明书实施例提供的一种意图识别模型训练及用户意图识别方法及装置，用于至少部分的解决现有技术中存在的问题。

本说明书采用下述技术方案：

本说明书提供了一种意图识别模型的训练方法，包括：

根据历史对话数据，确定各训练样本，所述训练样本包含多轮对话；

针对每个训练样本，通过训练完成的第一意图识别模型，分别确定该训练样本中各轮对话的用户意图，作为该训练样本的第一标注；

根据该训练样本，确定用户执行的与该训练样本对应的前序业务，以确定用户执行的与所述前序业务对应的后续业务，并基于所述后续业务对应的对话数据确定反馈意图，作为该训练样本对应的第二标注；

根据该训练样本对应的第一标注以及第二标注，确定该训练样本对应的第一风险识别结果；

将该训练样本输入待训练的第二意图识别模型，确定该训练样本对应的各预测意图以及第二风险识别结果；

根据各训练样本第一风险识别结果与第二风险识别结果之间的差异，确定损失，并以所述损失最小为优化目标对所述待训练的第二意图识别模型进行训练，所述第二意图识别模型用于与所述第一意图识别模型共同识别对话中由用户虚假意图引起的风险。

本说明书提供了一种用户意图识别方法，包括：

获取用户当前已进行的各轮次对话数据；

将当前轮次的对话数据输入第一意图识别模型，确定所述用户当前轮次的对话数据对应的第一意图；

根据已进行的各轮次对话数据对应的第一意图，确定所述对话数据对应的风险识别结果；

当根据所述风险识别结果确定不存在风险时，将当前已进行的指定轮次对话数据输入第二意图识别模型，确定所述输入的对话数据对应的各第二意图；

判断已进行的指定轮次对话数据对应的第一意图与各第二意图之间是否存在差异；

若是，则确定存在用户虚假意图引起的风险，提示所述用户存在风险；

其中，所述第二意图识别模型通过以若干段历史对话数据作为训练样本，根据由各训练样本对应的投诉意图以及所述第一意图识别模型确定出的用户意图确定出的第一风险识别结果、所述第二意图识别模型确定出的各预测意图以及第二风险识别结果，进行训练得到。

本说明书提供了一种意图识别模型的训练装置，包括：

训练样本确定模块，用于根据历史对话数据，确定各训练样本，所述训练样本包含多轮对话；

第一标注确定模块，用于针对每个训练样本，通过训练完成的第一意图识别模型，分别确定该训练样本中各轮对话的用户意图，作为该训练样本的第一标注；

第二标注确定模块，用于根据该训练样本，确定用户执行的与该训练样本对应的前序业务，以确定用户执行的与所述前序业务对应的后续业务，并基于所述后续业务对应的对话数据确定反馈意图，作为该训练样本对应的第二标注；

第一风险识别模块，用于根据该训练样本对应的第一标注以及第二标注，确定该训练样本对应的第一风险识别结果；

第二风险识别模块，用于将该训练样本输入待训练的第二意图识别模型，确定该训练样本对应的各预测意图以及第二风险识别结果；

训练模块，用于根据各训练样本第一风险识别结果与第二风险识别结果之间的差异，确定损失，并以所述损失最小为优化目标对所述待训练的第二意图识别模型进行训练，所述第二意图识别模型用于与所述第一意图识别模型共同识别对话中由用户虚假意图引起的风险。

本说明书提供了一种用户意图识别装置，包括：

获取模块，用于获取用户当前已进行的各轮次对话数据；

第一意图确定模块，用于将当前轮次的对话数据输入第一意图识别模型，确定所述用户当前轮次的对话数据对应的第一意图；

第一风险确定模块，用于根据已进行的各轮次对话数据对应的第一意图，确定所述对话数据对应的风险识别结果；

第二意图确定模块，用于当根据所述风险识别结果确定不存在风险时，将当前已进行的指定轮次对话数据输入第二意图识别模型，确定所述输入的对话数据对应的各第二意图；

第二风险确定模块，用于判断已进行的指定轮次对话数据对应的第一意图与各第二意图之间是否存在差异；若是，则确定存在用户虚假意图引起的风险，提示所述用户存在风险。

本说明书提供了一种计算机可读存储介质，所述存储介质存储有计算机程序，所述计算机程序被处理器执行时实现上述意图识别模型的训练方法或用户意图识别方法。

本说明书提供了一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现上述意图识别模型的训练方法或用户意图识别方法。

本说明书采用的上述至少一个技术方案能够达到以下有益效果：

在本说明书提供的意图识别模型训练及用户意图识别方法及装置，先确定包含多轮对话的历史对话数据作为训练样本，通过第一意图识别模型确定每个训练样本各轮对话的用户意图，并基于用户执行的与该训练样本对应的业务确定反馈意图，然后根据该训练样本的用户意图以及反馈意图确定第一风险识别结果，并通过第二意图识别模型确定该训练样本的各预测意图以及第二风险识别结果，最后以各训练样本第一风险识别结果与第二风险识别结果之间的差异最小为优化目标对第二意图识别模型进行训练。通过结合反馈意图以及由第一意图识别模型确定的用户意图，得到准确的风险识别结果，以对第二意图识别模型进行训练，提高了第二意图识别模型的风险识别能力。

附图说明

此处所说明的附图用来提供对本申请的进一步理解，构成本申请的一部分，本申请的示意性实施例及其说明用于解释本申请，并不构成对本申请的不当限定。在附图中：

图1为本说明书提供的一种意图识别模型的训练流程示意图；

图2为本说明书提供的一种用户意图识别流程示意图；

图3为本说明书提供的一种意图识别模型的训练装置示意图；

图4为本说明书提供的一种用户意图识别装置示意图；

图5为本说明书提供的一种实现意图识别模型的训练方法或用户意图识别方法的电子设备示意图。

具体实施方式

为使本说明书的目的、技术方案和优点更加清楚，下面将结合本说明书具体实施例及相应的附图对本申请技术方案进行清楚、完整地描述。显然，所描述的实施例仅是本申请一部分实施例，而不是全部的实施例。基于说明书中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

随着互联网的快速发展，越来越多的用户通过互联网完成各种需求，例如，网络购物、网络转账、外卖预定等等。由于网络的隐匿性，使得可能存在用户遭遇网络诈骗等损害用户利益的行为。因此，为了保障用户利益，业务平台的服务器通常需要与用户进行用户操作相关的对话，确认用户的操作行为是否存在风险，以及时发现风险并提示用户，避免用户利益受到损害。

一般的，业务平台的服务器可采用外呼或主动发起对话聊天等方式，通过多轮对话来完成与用户的沟通交流，从而根据每一轮对话结果，通过预先训练的模型，来识别该轮回答中显示的用户意图是否存在风险。但是，用户可能会因为处于被欺骗的状态，而不能完全配合业务平台，使得业务平台的服务器仅根据单轮的对话结果，难以正确识别用户意图，则无法及时发现用户的操作行为是否存在风险，风控的时效性和准确度较低。

以下结合附图，详细说明本申请各实施例提供的技术方案。

图1为本说明书中一种意图识别模型训练流程示意图，具体包括以下步骤：

S100：根据历史对话数据，确定各训练样本，所述训练样本包含多轮对话。

一般的，业务平台的服务器可根据用户数据，采用外呼等方式，主动与用户通过简单的对话沟通交流，在对话过程中，可保存具体的对话内容，以应用于其他业务。基于此，在本说明书一个或多个实施例中，业务平台的服务器可获取若干段历史对话数据，确定各训练样本，进行模型训练，该训练样本可包含多轮对话。

其中，所获取的历史对话数据可以是全部对话文本，还可以是问题的唯一编码与对应的用户回复的组合。通常，业务平台的服务器可预先设置多种问题模板，然后根据具体的用户以及具体的用户操作适应性地生成问题，因此，可预先给各问题模板进行编码，赋予各问题模板唯一性标识，则保存时可只保存问题模板的编码以及用户回复的文本内容。对应的，业务平台的服务器可获取问题的编码与对应的用户回复。

当然了，对于业务平台的服务器采取外呼的方式与用户交流时，可对外呼过程中采集到的用户语音进行语音识别，然后保存识别得到的用户回复的文本内容，使得业务平台的服务器可获取到问题的编码与对应的用户回复。对于并非采用语音通话方式与用户交流的情况，则可直接对应保存问题模板的编码以及用户回复。

此外，业务平台的服务器通常需要与用户进行多轮对话，从多个角度反复确认用户的行为是否存在风险，因此，服务器所获取的历史对话数据包含多轮对话对应的问题模板的编码以及用户回复。

本说明书中提到的服务器可以是设置于业务平台的服务器，或能够执行本说明书方案的诸如台式机、笔记本电脑等设备。为了方便说明，下面仅以服务器为执行主体进行说明。

在获取到若干段历史对话数据后，在本说明书一个或多个实施例中，业务平台的服务器还可根据获取到的若干段历史对话数据，对第二意图识别模型进行预训练。具体的，服务器可通过占位符随机替换各历史对话数据中至少部分用户回复，得到各预训练样本，并将被替换的各用户回复作为各预训练样本对应的对话标注，从而后续可通过待训练的第二意图识别模型对被替换的用户回复根据其他对话数据进行预测，学习到联系上下文进行推断的能力。其中，替换各历史对话数据中至少部分用户回复可以是指将多轮对话中部分对话的用户回复屏蔽(mask)。

得到各预训练样本以及对应的对话标注后，服务器可根据各预训练样本以及对话标注，先对待训练的第二意图识别模型进行预训练。

其中，第二意图识别模型可以是BERT模型，该BERT模型可以是经过预先训练的通用的语言表征模型，以此减少训练量。此外，考虑到在模型应用过程中，需要模型根据运算结果实时地进行反馈，因此，可采用层数较少的BERT模型，以提高运算效率，节省运算时间，如，可采用6层的BERT模型。当然了，具体采用何种模型，可根据需要确定，本说明书对此不做限制。

具体的，服务器可将预训练样本输入到待训练的第二意图识别模型的输入层，通过第二意图识别模型的第一输出层，确定被替换的各用户回复对应的预测语句，即，通过第二意图识别模型基于未被替换的对话数据与被替换的用户回复对应的问题之间的关系，根据被抽取的用户回复的字数，逐字或逐词的对被遮盖的用户回复进行预测，确定预测语句。

于是，服务器可根据各预训练样本对应的预测语句与对话标注之间的差异，确定损失，并以该损失最小为优化目标，预训练第二意图识别模型，直至达到训练结束条件为止，确定预训练得到的第二意图识别模型，使得第二意图识别模型可学习到联系上下文进行推断的能力。

其中，预测语句与标注答案的差异具体采用何种方式体现，可根据需要确定，本说明书对此不做限制。例如，可以通过编辑距离(Levenshtein，LEV)，或最长公共子序列(Longest Common Subsequence，LCS)长度等方式，计算该预测语句与该标注答案之间的相似度，相似度越高则差异越小。预训练结束条件可根据需要设置，本说明书对此不做限制。

通过大量的预训练样本进行预训练后，该第二意图识别模型即可掌握语句级别的联系上下文进行推断的能力。

S102：针对每个训练样本，通过训练完成的第一意图识别模型，分别确定该训练样本中各轮对话的用户意图，作为该训练样本的第一标注。

S104：根据该训练样本，确定用户执行的与该训练样本对应的前序业务，以确定用户执行的与所述前序业务对应的后续业务，并基于所述后续业务对应的对话数据确定反馈意图，作为该训练样本对应的第二标注。

获取到训练样本后，在本说明书一个或多个实施例中，服务器可进一步根据各训练样本、各训练样本对应的历史意图识别信息以及用户已进行的反馈行为，对该第二意图识别模型进行训练。

于是，对于各训练样本对应的历史意图识别信息，服务器可针对每个训练样本，通过训练完成的第一意图识别模型，分别确定该训练样本中各轮对话的用户意图，作为该训练样本的第一标注。

其中，第一意图识别模型可以是历史对话发生时，服务器所采用的意图识别模型，服务器可针对每个训练样本，先将该训练样本对应的历史对话数据中各轮对话分别输入训练完成的第一意图识别模型，分别确定各轮对话对应的用户意图，然后，根据各轮对话对应的用户意图，确定该训练样本对应的第一标注。各轮对话的用户意图是指对应每轮对话识别得到的所有意图，可以包含一个或多个意图。

例如，假设该训练样本对应的历史对话数据中包含3轮对话数据，则服务器可分别将每轮对话数据输入第一意图识别模型，通过第一意图识别模型分别确定每轮对话数据对应的用户意图，然后将3轮对话数据各自得到的用户意图作为该训练样本对应的历史对话数据的各用户意图。

具体第一意图识别模型如何根据对话数据确定用户意图，可根据需要确定，本说明书对此不做限制。例如，第一意图识别模型可根据用户回复进行命名实体识别，从而可根据用户回复，抽取出用户回复对应的意图信息。假设对于某历史对话数据，服务器在对话时，提出问句“请问你是在买什么商品”，对应的用户回复为“我在买家具”，则服务器可通过第一意图识别模型根据用户回复“我在买家具”抽取出对应该用户的(交易目的：家具)此类的意图信息。以上以一轮对话包含一个意图为例进行说明，但是，本说明书对具体每轮对话识别得到的意图数量不做限制。

当然了，还可以进一步对抽取得到的实体进一步分类，从而确定更进一步的用户意图，如，可将家具划分为实体类、虚拟类、有风险类、无风险类，于是，服务器可通过第一意图识别模型根据用户回复“我在买家具”抽取出对应该用户的(交易目的：实体无风险)此类的意图信息。以上仅为举例说明，本说明书对意图具体以何种方式体现不做限制。

此外，在本说明书一个或多个实施例中，服务器通过第一意图识别模型确定各训练样本的意图标注之外，服务器还可将历史对话发生时，该第一意图识别模型在历史时刻识别得到的各用户意图与历史对话对应存储，则服务器后续可直接获取存储的各训练样本对应的历史对话数据的各用户意图，作为各训练样本的意图标注。

对于用户已进行的反馈行为，服务器可先根据该训练样本，确定用户执行的与该训练样本，即该历史对话数据对应的前序业务，如，用户执行下单业务后，服务器可以通过外呼等方式，主动与用户取得联系，确定该下单业务的风险，在此过程中，服务器可存储本次对话对应的历史对话数据，该下单业务即为产生该历史对话数据的前序业务。

然后，服务器可根据该前序业务，确定用户执行的与该前序业务对应的后续业务。所说的后续业务可以是用户基于该前序业务执行的其他业务，在本说明书一个或多个实施例中，该后续业务可以是投诉业务。则服务器可根据该投诉业务对应的对话数据，确定该对话数据对应的用户意图，作为该训练样本对应的反馈意图，并将该反馈意图作为该训练样本对应的第二标注。

当然了，在本说明书一个或多个实施例中，后续业务还可以是评价业务或退货业务等用户基于该前序业务执行的其他业务，以评价业务为例，服务器可根据该评价业务对应的对话数据，确定该对话数据对应的用户意图，作为该训练样本对应的反馈意图，并将该反馈意图作为该训练样本对应的第二标注。后续业务为退货业务等其他业务与此同理，此处不再意义赘述。

假设用户因为受到诈骗导致该笔订单未能正常完成，用户对该笔订单发起投诉，投诉内容为“我在线上向线上认识的张三购买电脑，被张三诈骗”，则该投诉内容对应的用户意图可为(交易方式：线上)、(交易对象：张三)、(交易目的：贵重物品有风险)、(诈骗：确认)等。于是，可将该投诉内容对应的用户意图，作为该训练样本对应的投诉意图，从而作为该训练样本对应的第二标注。以上仅为举例说明，本说明书对负投诉反馈意图具体以何种方式体现不做限制。

当然，用户对于正常完成的业务通常不会执行对应的投诉业务，此时，该训练样本对应的第二标注为空，可认为第一意图识别模型识别得到的作为第一标注的用户意图为可信的，而用户因为受到诈骗等原因导致对未能正常执行的业务执行投诉业务后，可基于投诉内容识别得到作为第二标注的投诉意图，这种情况下，可认为第一意图识别模型识别得到的用户意图与投诉意图共同反映了用户的真实意图，该用户意图与该投诉意图的组合是可信的。后续可通过第一标注以及第二标注确定可信的第一风险识别结果，对待训练的意图识别模型进行训练。

S106：根据该训练样本对应的第一标注以及第二标注，确定该训练样本对应的第一风险识别结果。

S108：将该训练样本输入待训练的第二意图识别模型，确定该训练样本对应的各预测意图以及第二风险识别结果。

通过上述确定训练样本对应的第一标注以及第二标注后，在本说明书一个或多个实施例中，服务器可先根据该训练样本对应的第一标注以及第二标注，确定该训练样本对应的第一风险识别结果，从而进一步根据该第一风险识别结果，对待训练的第二意图识别模型进行训练。

具体的，服务器可预先确定存在风险的各风险意图组合，如，意图组合(交易方式：线上个人、交易目的：贵重物品)可作为存在风险的的风险意图组合。当然了，风险意图组合并不限制意图组合中意图的个数，如，(交易目的：虚拟物品有风险)可作为存在风险的风险意图组合，该组合中可仅有这一个意图。

然后，服务器可根据各风险意图组合，判断该训练样本对应的第一标注以及第二标注的组合，是否与任一风险意图组合匹配，若是，则确定该训练样本对应的第一风险识别结果为存在风险，若否，则确定该训练样本对应的第一风险识别结果为不存在风险。

其中，第二标注可视为对第一标注的补充，通常，由第一意图识别模型的确定的意图标注可能并不完全准确，例如，当用户处于被欺骗状态而不能完全配合服务器对话了解情况时，用户可能会给出虚假的回答，则第一意图识别模型会根据用户虚假的回答，识别得到用户的虚假意图。而当用户在脱离被欺骗状态后，可能会向服务器基于产生对应的历史对话数据的用户执行的前序业务，执行后续业务，如投诉业务。以投诉业务为例，则服务器可进一步根据用户执行的投诉业务的对话数据，确定该对话数据对应的用户意图，从而确定该训练样本对应的第二标注。并以第二标注对第一标注进行补充，使得第二标注对第一标注能够真实反映该训练样本对应的用户意图。则服务器可根据该训练样本对应的意图标注和投诉反馈意图，确定可信的第一风险识别结果，并根据该第一风险识别结果对第二意图识别模型进行训练。

假设该训练样本对应的第一标注和第二标注的组合为(交易方式：线上个人、交易目的：虚拟物品有风险)，则以前述的风险意图组合为例，该训练样本对应的第一风险识别结果为存在风险。假设该训练样本对应的第一标注和第二标注的组合为(交易方式：线下门店、交易目的：实物)，则还以上述的风险意图组合为例，该训练样本对应的第一风险识别结果为不存在风险。

在确定第一风险识别结果后，用户可将该训练样本输入待训练的意图识别模型，通过联系多轮对话上下文综合用户回复以及多轮对话之间的联系，确定该训练样本对应的各预测意图以及第二风险识别结果。

在得到该训练样本对应的各预测意图后，服务器可根据各预测意图，确定第二风险识别结果，后续可根据第一风险识别结果，对第二意图识别模型进行训练。

具体的，服务器可据预设的存在风险的各风险意图组合，判断该训练样本对应的各预测意图的组合，是否与任一风险意图组合匹配，若是，则确定该训练样本对应的第二风险识别结果为存在风险，若否，则确定该训练样本对应的第二风险识别结果为不存在风险。具体过程与确定第一风险识别结果的过程同理，可参考前述对应说明。

当然了，在本说明书一个或多个实施例中，若第二意图识别模型在步骤S108之前经过了步骤S100中所说的预训练过程，则服务器可将预训练得到的第二意图识别模型的第一输出层替换为第二输出层，该第二输出层设置为用于根据训练样本输出预测意图。

然后服务器可将该训练样本输入预训练得到的第二意图识别模型的输入层，通过该第二输出层，得到该训练样本对应的各预测意图。

此时，对于预训练后的意图识别模型，在根据输入的训练样本确定该训练样本对应的用户意图时，并非仅根据用户回复进行客观意图识别，经过了联系上下文进行推断的预训练后，该预训练后的意图识别模型可综合用户回复以及多轮对话之间的联系进行意图识别，从而识别得到更准确的各预测意图。通过预训练，提高了第二意图识别模型的训练效率。

S110：根据各训练样本第一风险识别结果与第二风险识别结果之间的差异，确定损失，并以所述损失最小为优化目标对所述待训练的第二意图识别模型进行训练。

通过上述确定训练样本对应的第一意图识别结果以及第二风险识别结果后，服务器可根据各训练样本第一意图识别结果与第二风险识别结果之间的差异，确定损失，并以该损失最小为优化目标，对待训练的第二意图识别模型进行训练。

具体如何采用何种算法确定损失，可根据需要确定，本说明书对此不做限制。例如，以风险识别结果存在风险为1，不存在风险为0，可根据各各训练样本第一风险识别结果与第二风险识别结果之间的差的平方和，确定损失。

通过不断的迭代训练后，可使得该意图识别模型能够在迭代训练过程中，不断的提高预测意图的准确度，从而提高风险识别准确度。

基于图1所示的意图识别模型训练方法，先确定包含多轮对话的历史对话数据作为训练样本，通过第一意图识别模型确定每个训练样本各轮对话的用户意图，并基于用户执行的与该训练样本对应的业务确定反馈意图，然后根据该训练样本的用户意图以及反馈意图确定第一风险识别结果，并通过第二意图识别模型确定该训练样本的各预测意图以及第二风险识别结果，最后以各训练样本第一风险识别结果与第二风险识别结果之间的差异最小为优化目标对第二意图识别模型进行训练。通过结合反馈意图以及由第一意图识别模型确定的用户意图，得到准确的风险识别结果，以对第二意图识别模型进行训练，提高了第二意图识别模型的风险识别能力。

基于图1提供的意图识别模型的训练方法，本说明书还提供一种用户意图识别方法，如图2所示。

图2为本说明书中一种用户意图识别流程示意图，具体包括以下步骤：

S200：获取用户当前已进行的各轮次对话数据。

一般的，业务平台的服务器可采用外呼或主动发起对话聊天等方式，通过多轮对话来完成与用户的沟通交流，从而及时发现用户的操作风险，进行风控。

于是，在本说明书一个或多个实施例中，业务平台的服务器可获取用户当前已进行的各轮次对话数据，从而基于已进行的各轮次对话数据，识别用户意图，对识别结果确认为存在风险的情况进行提示。

其中，当前已进行的各轮次对话数据，可包括截止到当前时刻，已完成的各轮对话中，各轮对话服务器所提出的问题以及对应的用户回复。当然了，对于服务器所提出的问题，可根据预先对问题模板的编码，只保存服务器所提出的问题模板对应的编码，则各轮次对话数据可包含各轮对话服务器所提出的问题模板的编码以及对应的用户回复。模板问题的具体内容可参考步骤S100中的相应说明，此处不再赘述。

S202：将当前轮次的对话数据输入第一意图识别模型，确定所述用户当前轮次的对话数据对应的第一意图。

S204：根据已进行的各轮次对话数据对应的第一意图，确定所述对话数据对应的风险识别结果。

S206：当根据所述风险识别结果确定不存在风险时，将当前已进行的指定轮次对话数据输入第二意图识别模型，确定所述输入的对话数据对应的各第二意图。

在完成第二意图识别模型的训练后，即可在风控场景使用经本说明书提供的意图识别模型训练方法训练后的第二意图识别模型。

当然了，服务器可先使用第一意图识别模型，将当前轮次的对话数据输入第一意图识别模型，确定用户当前轮次的对话数据对应的第一意图。其中，第一意图是指对应当前轮次的对话数据识别得到的所有意图，可以包含一个或多个意图。

然后，服务器可根据已确定出的各第一意图，确定已进行的各轮对话数据对应的第一风险识别结果。具体的，服务器可逐轮保存第一意图识别模型确定得到的每轮对话数据对应的各第一意图，然后根据预设的存在风险的各风险意图组合，判断已进行的各轮次对话数据对应的第一意图的组合，即，已保存的各第一意图和当前轮次的对话数据对应的第一意图的组合，是否与任一风险意图组合匹配，若是，则确定当前轮次的对话数据对应的第一风险识别结果为存在风险，若否，则确定当前轮次的对话数据对应的第一风险识别结果为不存在风险。风险意图组合的具体内容，可参考前述步骤S106中的相应描述，此处不再赘述。当然，对于每轮对话来说，当前轮次下确定的第一风险识别结果，都是加入了当前轮次的对话数据对应的第一意图后识别得到的结果，因此，当前轮次下确定的第一风险识别结果也可以说是对应于当前轮次的对话数据。

当确定该第一意图存在风险时，服务器可直接确定风险，并提示用户本次对话对应的用户执行的前序业务存在风险。具体前序业务的内容可参考前述步骤S106中的相应说明，此处不再赘述。

当确定该第一意图不存在风险时，往往存在两种可能性，其中一种可能是用户的操作为正常操作，确实不存在风险，另一种可能是用户受到欺骗，不能完全配合业务平台的服务器发起的对话，即用户针对服务器的问题选择隐瞒性的说谎，给出了虚假的回答，而第一意图识别模型根据用户的虚假回答，识别得到了虚假意图。

此时，服务器可将当前已进行的指定轮次对话数据输入第二意图识别模型，确定所输入的对话数据对应的各第二意图。其中，指定轮次可以根据需要，或模型输入参数的设置而确定，本说明书对此不做限制。当然，即使已进行的对话轮数小于指定轮数，服务器也可将已进行的各轮次对话数据输入第二意图识别模型。此外，指定轮数可以是在已进行的对话轮数较多的情况下，选择部分输入第二意图识别模型。当然了，这里的指定轮数还可以是指每次输入第二意图识别模型的轮数，此时，即使已进行的对话轮数大于指定轮数，服务器也可将以进行的各轮次对话数据分批输入第二意图识别模型。当然了，通常输入的对话数据轮次越多，则模型进行意图识别的准确度越高，相对应的，模型运行所需的时间越长，将识别结果进行反馈的时效性越差。

这里的第二意图识别模型通过以若干段历史对话数据作为训练样本，根据由各训练样本对应的反馈意图以及所述第一意图识别模型确定出的用户意图确定出的第一风险识别结果、所述第二意图识别模型确定出的各预测意图以及第二风险识别结果，进行训练得到。第二意图识别模型具体可基于前述提供的任一意图识别模型的训练方法训练得到。

S208：判断已进行的指定轮次对话数据对应的第一意图与各第二意图之间是否存在差异，若是，则执行步骤S210。

S210：确定存在用户虚假意图引起的风险，提示所述用户存在风险。

通过上述确定各第一意图以及各第二意图后，在本说明书一个或多个实施例中，服务器可根据各第一意图以及各第二意图，判断各第一意图以及各第二意图之间是否存在差异。

具体的，服务器可根据已确定的与各第二意图对应的各第一意图和各第二意图，判断各第一意图与各第二意图之间是否存在差异。若存在差异，则说明用户可能在当前轮次的对话中给出的用户回复与已进行的对话轮次数据中所显示的信息存在冲突，用户可能在当前轮次的对话中给出了虚假的用户回复，则用户可能处于被欺骗的状态，本次对话对应的用户执行的业务可能存在用户虚假意图引起的风险，服务器可及时对用户做出提示。若不存在差异，则说明用户在整个对话过程中，表现的前后较为一致，所有已进行的对话轮次中所显示的信息不存在冲突，则可继续进行下一轮对话，直至完成整个对话过程。

此外，在本说明书一个或多个实施例中，步骤S206中，服务器将当前已进行的指定轮次对话数据输入第二意图识别模型，确定所述输入的对话数据对应的各第二意图时，由于第二意图识别模型是根据用户的多轮对话数据进行意图识别，因此，若已进行的对话轮次较少时，可能难以得到较为准确的识别结果，于是，服务器还可根据预设对话轮次数量，判断当前对话轮次是否小于该对话轮次数量，若是，则继续下轮对话直至对话轮次达到预设对话轮次数量，若否，则说明已有足够的对话数据，则服务器可将当前已进行的指定轮次对话数据输入第二意图识别模型，确定用户当前轮次的对话数据对应的各第二意图。确定各第二意图的具体内容可参考前述相应说明，此处不在赘述。

另外，在本说明书一个或多个实施例中，步骤S206中，服务器将当前已进行的指定轮次对话数据输入第二意图识别模型，确定所述用户当前轮次的对话数据对应的各第二意图时，服务器还可根据对话数据的长度，确定指定轮次。此时，服务器可根据已进行的对话数据的长度，将已进行的对话数据分批输入第二意图识别模型，每次输出第二意图识别模型中的对话数据的轮次数量可以不同，使得输入对话数据时更加灵活。

另外，在本说明书一个或多个实施例中，步骤S208中，服务器判断已进行的指定轮次对话数据对应的第一意图与各第二意图之间是否存在差异时，可先根据预设的各风险意图组合，判断各第二意图的组合，是否与任一风险意图组合匹配，若是，则确定存在用户虚假意图引起的风险，提示所述用户存在风险，若否，则判断已进行的指定轮次对话数据对应的第一意图与各第二意图之间是否存在差异。即，先根据已确定的各第二意图进行二次判断，确定是否与确定得到的第一风险识别结果一致，若一致，则进一步判断，若不一致，则说明用户可能处于被欺骗的状态，本次对话对应的用户执行的业务可能存在用户虚假意图引起的风险，服务器可及时对用户做出提示。

以上为本说明书的一个或多个实施例提供的意图识别模型的训练方法，基于同样的思路，本说明书还提供了相应的意图识别模型的训练装置，如图3所示。

图3为本说明书提供的一种意图识别模型的训练装置示意图，包括：

训练样本确定模块300，用于根据历史对话数据，确定各训练样本，所述训练样本包含多轮对话；

第一标注确定模块302，用于针对每个训练样本，通过训练完成的第一意图识别模型，分别确定该训练样本中各轮对话的用户意图，作为该训练样本的第一标注；

第二标注确定模块304，用于根据该训练样本，确定用户执行的与该训练样本对应的前序业务，以确定用户执行的与所述前序业务对应的后续业务，并基于所述后续业务对应的对话数据确定反馈意图，作为该训练样本对应的第二标注；

第一风险识别模块306，用于根据该训练样本对应的第一标注以及第二标注，确定该训练样本对应的第一风险识别结果；

第二风险识别模块308，用于将该训练样本输入待训练的第二意图识别模型，确定该训练样本对应的各预测意图以及第二风险识别结果；

训练模块310，用于根据各训练样本第一风险识别结果与第二风险识别结果之间的差异，确定损失，并以所述损失最小为优化目标对所述待训练的第二意图识别模型进行训练，所述第二意图识别模型用于与所述第一意图识别模型共同识别对话中由用户虚假意图引起的风险。

可选地，所述装置还包括：预训练模块312，用于通过采用占位符替换训练样本的各轮对话中至少部分用户回复，得到各预训练样本，根据被替换的用户回复，确定各预训练样本的对话标注，将各预训练样本输入待训练的第二意图识别模型的输入层，通过所述第二意图识别模型的第一输出层，确定被替换的各用户回复对应的预测语句，以各预训练样本对应的预测语句与对话标注差异最小为优化目标，对所述待训练的第二意图识别模型进行预训练，直至达到训练结束条件为止，确定预训练得到的第二意图识别模型。

可选地，所述第二风险识别模块308，将所述预训练得到的第二意图识别模型的第一输出层替换为第二输出层，所述第二输出层设置为用于输出预测意图，将该训练样本输入所述预训练得到的第二意图识别模型的输入层，通过所述第二输出层，得到该训练样本对应的各预测意图。

可选地，所述第二标注确定模块304，根据该训练样本对应的历史对话数据，确定产生所述历史对话数据的前序业务，根据所述前序业务，确定用户执行的与所述前序业务对应的投诉业务，根据确定出的投诉业务对应的对话数据，确定所述对话数据对应的用户意图，作为该训练样本对应的反馈意图。

可选地，所述第一风险识别模块306，根据预设的各风险意图组合，判断该训练样本对应的第一标注与第二标注的组合，是否与任一风险意图组合匹配，若是，则确定该训练样本对应的第一风险识别结果为存在风险，若否，则确定该训练样本对应的第一风险识别结果为不存在风险。

可选地，所述第二风险识别模块308，据预设的各风险意图组合，判断该训练样本对应的各预测意图的组合，是否与任一风险意图组合匹配，若是，则确定该训练样本对应的第二风险识别结果为存在风险，若否，则确定该训练样本对应的第二风险识别结果为不存在风险。

基于本说明书的一个或多个实施例提供的用户意图识别方法，本说明书还提供了相应的用户意图识别装置，如图4所示。

图4为本说明书提供的一种用户意图识别装置示意图，包括：

获取模块400，用于获取用户当前已进行的各轮次对话数据；

第一意图确定模块402，用于将当前轮次的对话数据输入第一意图识别模型，确定所述用户当前轮次的对话数据对应的第一意图；

第一风险确定模块404，用于根据已进行的各轮次对话数据对应的第一意图，确定所述对话数据对应的风险识别结果；

第二意图确定模块406，用于当根据所述风险识别结果确定不存在风险时，将当前已进行的指定轮次对话数据输入第二意图识别模型，确定所述输入的对话数据对应的各第二意图；

第二风险确定模块408，用于判断已进行的指定轮次对话数据对应的第一意图与各第二意图之间是否存在差异，若是，则确定存在用户虚假意图引起的风险，提示所述用户存在风险。

可选地，所述第二风险确定模块408，根据预设的各风险意图组合，判断各第二意图的组合，是否与任一风险意图组合匹配，若是，则确定存在用户虚假意图引起的风险，提示所述用户存在风险，若否，则判断已进行的指定轮次对话数据对应的第一意图与各第二意图之间是否存在差异。

可选地，所述第一风险确定模块404，根据预设的各风险意图组合，判断已进行的各轮次对话数据对应的第一意图的组合，是否与任一风险意图组合匹配，若是，则确定所述对话数据对应的风险识别结果为存在风险，若否，则确定所述对话数据对应的风险识别结果为不存在风险。

本说明书还提供了一种计算机可读存储介质，该存储介质存储有计算机程序，计算机程序可用于执行上述图1提供的意图识别模型的训练方法或图2提供的用户意图识别方法。

本说明书还提供了图5所示的电子设备的结构示意图。如图5所述，在硬件层面，该电子设备包括处理器、内部总线、网络接口、内存以及非易失性存储器，当然还可能包括其他业务所需要的硬件。处理器从非易失性存储器中读取对应的计算机程序到内存中然后运行，以实现上述图1提供的意图识别模型的训练方法或图2提供的用户意图识别方法。

当然，除了软件实现方式之外，本说明书并不排除其他实现方式，比如逻辑器件异或软硬件结合的方式等等，也就是说以下处理流程的执行主体并不限定于各个逻辑单元，也可以是硬件或逻辑器件。

在20世纪90年代，对于一个技术的改进可以很明显地区分是硬件上的改进(例如，对二极管、晶体管、开关等电路结构的改进)还是软件上的改进(对于方法流程的改进)。然而，随着技术的发展，当今的很多方法流程的改进已经可以视为硬件电路结构的直接改进。设计人员几乎都通过将改进的方法流程编程到硬件电路中来得到相应的硬件电路结构。因此，不能说一个方法流程的改进就不能用硬件实体模块来实现。例如，可编程逻辑器件(Programmable Logic Device,PLD)(例如现场可编程门阵列(Field Programmable GateArray，FPGA))就是这样一种集成电路，其逻辑功能由用户对器件编程来确定。由设计人员自行编程来把一个数字系统“集成”在一片PLD上，而不需要请芯片制造厂商来设计和制作专用的集成电路芯片。而且，如今，取代手工地制作集成电路芯片，这种编程也多半改用“逻辑编译器(logic compiler)”软件来实现，它与程序开发撰写时所用的软件编译器相类似，而要编译之前的原始代码也得用特定的编程语言来撰写，此称之为硬件描述语言(Hardware Description Language，HDL)，而HDL也并非仅有一种，而是有许多种，如ABEL(Advanced Boolean Expression Language)、AHDL(Altera Hardware DescriptionLanguage)、Confluence、CUPL(Cornell University Programming Language)、HDCal、JHDL(Java Hardware Description Language)、Lava、Lola、MyHDL、PALASM、RHDL(RubyHardware Description Language)等，目前最普遍使用的是VHDL(Very-High-SpeedIntegrated Circuit Hardware Description Language)与Verilog。本领域技术人员也应该清楚，只需要将方法流程用上述几种硬件描述语言稍作逻辑编程并编程到集成电路中，就可以很容易得到实现该逻辑方法流程的硬件电路。

控制器可以按任何适当的方式实现，例如，控制器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(Application Specific Integrated Circuit，ASIC)、可编程逻辑控制器和嵌入微控制器的形式，控制器的例子包括但不限于以下微控制器：ARC625D、Atmel AT91SAM、Microchip PIC18F26K20以及Silicone Labs C8051F320，存储器控制器还可以被实现为存储器的控制逻辑的一部分。本领域技术人员也知道，除了以纯计算机可读程序代码方式实现控制器以外，完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件，而对其内包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至，可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。

上述实施例阐明的系统、装置、模块或单元，具体可以由计算机芯片或实体实现，或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的，计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。

为了描述的方便，描述以上装置时以功能分为各种单元分别描述。当然，在实施本说明书时可以把各单元的功能在同一个或多个软件和/或硬件中实现。

本领域内的技术人员应明白，本发明的实施例可提供为方法、系统、或计算机程序产品。因此，本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

在一个典型的配置中，计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。

内存可能包括计算机可读介质中的非永久性存储器，随机存取存储器(RAM)和/或非易失性内存等形式，如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。

计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括，但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带，磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质，可用于存储可以被计算设备访问的信息。按照本文中的界定，计算机可读介质不包括暂存电脑可读媒体(transitory media)，如调制的数据信号和载波。

还需要说明的是，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。

本领域技术人员应明白，本说明书的实施例可提供为方法、系统或计算机程序产品。因此，本说明书可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且，本说明书可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本说明书可以在由计算机执行的计算机可执行指令的一般上下文中描述，例如程序模块。一般地，程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本说明书，在这些分布式计算环境中，由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中，程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。

本说明书中的各个实施例均采用递进的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于系统实施例而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

以上所述仅为本说明书的实施例而已，并不用于限制本说明书。对于本领域技术人员来说，本说明书可以有各种更改和变化。凡在本说明书的精神和原理之内所作的任何修改、等同替换、改进等，均应包含在本说明书的权利要求范围之内。

Claims

1.一种意图识别模型的训练方法，所述方法包括：

2.如权利要求1所述的方法，将该训练样本输入待训练的第二意图识别模型，确定该训练样本对应的各预测意图以及第二风险识别结果之前，所述方法还包括：

通过采用占位符替换训练样本的各轮对话中至少部分用户回复，得到各预训练样本，根据被替换的用户回复，确定各预训练样本的对话标注；

将各预训练样本输入待训练的第二意图识别模型的输入层，通过所述第二意图识别模型的第一输出层，确定被替换的各用户回复对应的预测语句；

以各预训练样本对应的预测语句与对话标注差异最小为优化目标，对所述待训练的第二意图识别模型进行预训练，直至达到训练结束条件为止，确定预训练得到的第二意图识别模型。

3.如权利要求2所述的方法，将该训练样本输入待训练的第二意图识别模型，确定该训练样本对应的各预测意图，具体包括：

将所述预训练得到的第二意图识别模型的第一输出层替换为第二输出层，所述第二输出层设置为用于输出预测意图；

将该训练样本输入所述预训练得到的第二意图识别模型的输入层，通过所述第二输出层，得到该训练样本对应的各预测意图。

4.如权利要求1所述的方法，确定用户执行的与该训练样本对应的前序业务，确定用户执行的与所述前序业务对应的后续业务，并基于所述后续业务对应的对话数据确定反馈意图，具体包括：

根据该训练样本对应的历史对话数据，确定产生所述历史对话数据的前序业务；

根据所述前序业务，确定用户执行的与所述前序业务对应的投诉业务；

根据确定出的投诉业务对应的对话数据，确定所述对话数据对应的用户意图，作为该训练样本对应的反馈意图。

5.如权利要求1所述的方法，根据该训练样本对应的第一标注以及第二标注，确定该训练样本对应的第一风险识别结果，具体包括：

根据预设的各风险意图组合，判断该训练样本对应的第一标注与第二标注的组合，是否与任一风险意图组合匹配；

若是，则确定该训练样本对应的第一风险识别结果为存在风险；

若否，则确定该训练样本对应的第一风险识别结果为不存在风险。

6.如权利要求1所述的方法，确定该训练样本对应的第二风险识别结果，具体包括：

据预设的各风险意图组合，判断该训练样本对应的各预测意图的组合，是否与任一风险意图组合匹配；

若是，则确定该训练样本对应的第二风险识别结果为存在风险；

若否，则确定该训练样本对应的第二风险识别结果为不存在风险。

7.一种用户意图识别方法，所述方法包括：

获取用户当前已进行的各轮次对话数据；

其中，所述第二意图识别模型通过以若干段历史对话数据作为训练样本，根据由各训练样本对应的反馈意图以及所述第一意图识别模型确定出的用户意图确定出的第一风险识别结果、所述第二意图识别模型确定出的各预测意图以及第二风险识别结果，进行训练得到。

8.如权利要求7所述的方法，判断已进行的指定轮次对话数据对应的第一意图与各第二意图之间是否存在差异，具体包括：

根据预设的各风险意图组合，判断各第二意图的组合，是否与任一风险意图组合匹配；

若否，则判断已进行的指定轮次对话数据对应的第一意图与各第二意图之间是否存在差异。

9.如权利要求7所述的方法，根据已进行的各轮次对话数据对应的第一意图，确定所述对话数据对应的风险识别结果，具体包括：

根据预设的各风险意图组合，判断已进行的各轮次对话数据对应的第一意图的组合，是否与任一风险意图组合匹配；

若是，则确定所述对话数据对应的风险识别结果为存在风险；

若否，则确定所述对话数据对应的风险识别结果为不存在风险。

10.一种意图识别模型的训练装置，所述装置包括：

11.一种用户意图识别装置，所述装置包括：

获取模块，用于获取用户当前已进行的各轮次对话数据；

12.一种计算机可读存储介质，所述存储介质存储有计算机程序，所述计算机程序被处理器执行时实现上述权利要求1～9任一项所述的方法。

13.一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现上述权利要求1～9任一项所述的方法。