CN113761183A

CN113761183A - 意图识别方法和意图识别装置

Info

Publication number: CN113761183A
Application number: CN202010752735.5A
Authority: CN
Inventors: 冯明超; 王泽勋
Original assignee: Beijing Huijun Technology Co ltd
Current assignee: Beijing Huijun Technology Co ltd
Priority date: 2020-07-30
Filing date: 2020-07-30
Publication date: 2021-12-07

Abstract

本发明公开了意图识别方法和意图识别装置，涉及计算机技术领域。该方法的一具体实施方式包括：获取待识别语句对应的待识别文本向量和待识别语句对应的目标流程；从类别表征数据库中，查询目标流程对应的至少一个目标表征向量，计算待识别文本向量与至少一个目标表征向量之间的文本距离；基于计算的文本距离，根据至少一个目标表征向量，识别待识别语句对应的意图类别。该实施方式能够实现仅对目标流程对应的意图类别进行判断，提高意图识别准确率，减少运营维护成本。

Description

意图识别方法和意图识别装置

技术领域

本发明涉及计算机技术领域，尤其涉及一种意图识别方法和意图识别装置。

背景技术

在对话系统中，意图识别就是根据用户的输入文本进行意图分类，不同的类别代表用户的不同意图。多流程对话系统是其中的一个重要场景，其是指需要用户和智能系统进行多轮交互，以实现相应的业务。在多流程对话的业务场景中，现有意图识别的主要方法：对业务覆盖的所有意图类别综合训练，得到一个综合意图识别模型；然后在每一个流程中，使用此综合意图识别模型进行意图识别。

在实现本发明过程中，发明人发现现有技术中至少存在如下问题：一、对于多流程对话系统，采用综合意图识别模型识别每个流程的意图，会引入此流程不会出现的意图类别，且前序流程的意图识别错误，影响后续流程的应答；二、如果需要对意图或流程进行调整时，需要重新训练一个综合意图识别模型，较繁琐，还会导致模型越来越庞大，还需要运营不断维护。

发明内容

有鉴于此，本发明实施例提供一种意图识别方法和意图识别装置，能够实现仅对目标流程对应的意图类别进行判断，提高意图识别准确率，减少运营维护成本。

为实现上述目的，根据本发明实施例的第一方面，提供了一种意图识别方法。

本发明实施例的一种意图识别方法，包括：获取待识别语句对应的待识别文本向量和所述待识别语句对应的目标流程；从类别表征数据库中，查询所述目标流程对应的至少一个目标表征向量，计算所述待识别文本向量与所述至少一个目标表征向量之间的文本距离；基于计算的文本距离，根据所述至少一个目标表征向量，识别所述待识别语句对应的意图类别。

可选地，所述方法还包括：获取配置的流程，确定所述配置的流程对应的至少一个意图类别，所述配置的流程的个数为至少一个；根据所述至少一个意图类别对应的原始语句，生成所述至少一个意图类别对应的表征向量，以得到所述配置的流程对应的表征向量；将所述配置的流程对应的表征向量加入所述类别表征数据库中，以构建所述类别表征数据库。

可选地，根据所述至少一个意图类别对应的原始语句，生成所述至少一个意图类别对应的表征向量，包括：针对一个意图类别，根据所述一个意图类别对应的原始语句，生成所述一个意图类别对应的训练文本向量；基于无监督聚类算法，将所述训练文本向量聚成至少一类，计算至少一类训练文本向量对应的表征向量；根据所述至少一类训练文本向量对应的表征向量，生成所述至少一个意图类别对应的表征向量。

可选地，所述根据所述一个意图类别对应的原始语句，生成所述一个意图类别对应的训练文本向量，包括：获取所述一个意图类别对应的原始语句；采用同义词替换和/或翻译器回译的方式，对所述原始语句进行扩充，获得所述一个意图类别对应的训练语句；基于Word2vec模型和TF-IDF，对所述训练语句进行向量化处理，生成所述一个意图类别对应的训练文本向量。

可选地，所述获取待识别语句对应的待识别文本向量和所述待识别语句对应的目标流程，包括：获取所述待识别语句；利用Word2vec模型，将所述待识别语句进行向量化处理，得到所述待识别语句对应的待识别文本向量；从所述配置的流程中，确定所述待识别语句对应的目标流程。

可选地，所述基于计算的文本距离，根据所述至少一个目标表征向量，识别所述待识别语句对应的意图类别，包括：选择所述文本距离中的距离最小值，确定所述距离最小值对应的目标表征向量为所述待识别语句对应的意图表征向量；确定所述意图表征向量对应的意图类别为所述待识别语句对应的意图类别。

可选地，所述基于计算的文本距离，根据所述至少一个目标表征向量，识别所述待识别语句对应的意图类别，包括：基于预设条件，从所述文本距离中选择距离值小的至少一个可选文本距离；根据所述至少一个可选文本距离对应的目标表征向量，确定所述至少一个可选文本距离对应的可选意图类别；选择出现次数值最多的可选意图类别为所述待识别语句对应的意图类别。

可选地，所述方法还包括：接收流程补充请求，将待补充流程添加至所述配置的流程中，生成所述待补充流程对应的表征向量，并将生成的表征向量加入所述类别表征数据库中；以及，接收流程删除请求，将待删除流程从所述配置的流程中删除，并将所述待删除流程对应的表征向量从所述类别表征数据库中删除。

可选地，所述方法还包括：接收意图类别补充请求，生成待补充意图类别对应的表征向量；确定所述待补充意图类别对应的流程，根据生成的表征向量更新确定的流程对应的表征向量，以更新所述类别表征数据库；以及，接收意图类别删除请求，将待删除意图类别对应的表征向量从所述类别表征数据库中删除。

为实现上述目的，根据本发明实施例的第二方面，提供了一种意图识别装置。

本发明实施例的一种意图识别装置，包括：获取模块，用于获取待识别语句对应的待识别文本向量和所述待识别语句对应的目标流程；计算模块，用于从类别表征数据库中，查询所述目标流程对应的至少一个目标表征向量，计算所述待识别文本向量与所述至少一个目标表征向量之间的文本距离；识别模块，用于基于计算的文本距离，根据所述至少一个目标表征向量，识别所述待识别语句对应的意图类别。

可选地，所述计算模块还用于：获取配置的流程，确定所述配置的流程对应的至少一个意图类别，所述配置的流程的个数为至少一个；根据所述至少一个意图类别对应的原始语句，生成所述至少一个意图类别对应的表征向量，以得到所述配置的流程对应的表征向量；将所述配置的流程对应的表征向量加入所述类别表征数据库中，以构建所述类别表征数据库。

可选地，所述计算模块还用于：针对一个意图类别，根据所述一个意图类别对应的原始语句，生成所述一个意图类别对应的训练文本向量；基于无监督聚类算法，将所述训练文本向量聚成至少一类，计算至少一类训练文本向量对应的表征向量；根据所述至少一类训练文本向量对应的表征向量，生成所述至少一个意图类别对应的表征向量。

可选地，所述计算模块还用于：获取所述一个意图类别对应的原始语句；采用同义词替换和/或翻译器回译的方式，对所述原始语句进行扩充，获得所述一个意图类别对应的训练语句；基于Word2vec模型和TF-IDF，对所述训练语句进行向量化处理，生成所述一个意图类别对应的训练文本向量。

可选地，所述获取模块还用于：获取所述待识别语句；利用Word2vec模型，将所述待识别语句进行向量化处理，得到所述待识别语句对应的待识别文本向量；从所述配置的流程中，确定所述待识别语句对应的目标流程。

可选地，所述识别模块还用于：选择所述文本距离中的距离最小值，确定所述距离最小值对应的目标表征向量为所述待识别语句对应的意图表征向量；确定所述意图表征向量对应的意图类别为所述待识别语句对应的意图类别。

可选地，所述识别模块还用于：基于预设条件，从所述文本距离中选择距离值小的至少一个可选文本距离；根据所述至少一个可选文本距离对应的目标表征向量，确定所述至少一个可选文本距离对应的可选意图类别；选择出现次数值最多的可选意图类别为所述待识别语句对应的意图类别。

可选地，所述计算模块还用于：接收流程补充请求，将待补充流程添加至所述配置的流程中，生成所述待补充流程对应的表征向量，并将生成的表征向量加入所述类别表征数据库中；以及，接收流程删除请求，将待删除流程从所述配置的流程中删除，并将所述待删除流程对应的表征向量从所述类别表征数据库中删除。

可选地，所述计算模块还用于：接收意图类别补充请求，生成待补充意图类别对应的表征向量；确定所述待补充意图类别对应的流程，根据生成的表征向量更新确定的流程对应的表征向量，以更新所述类别表征数据库；以及，接收意图类别删除请求，将待删除意图类别对应的表征向量从所述类别表征数据库中删除。

为实现上述目的，根据本发明实施例的第三方面，提供了一种电子设备。

本发明实施例的一种电子设备包括：一个或多个处理器；存储装置，用于存储一个或多个程序，当一个或多个程序被一个或多个处理器执行，使得一个或多个处理器实现本发明实施例的意图识别方法。

为实现上述目的，根据本发明实施例的第四方面，提供了一种计算机可读介质。

本发明实施例的一种计算机可读介质，其上存储有计算机程序，程序被处理器执行时实现本发明实施例的意图识别方法。

上述发明中的一个实施例具有如下优点或有益效果：首先获取待识别语句对应的目标流程，接着从类别表征数据库中查询到目标流程对应的目标表征向量，然后根据目标表征向量进行意图识别，能够实现仅对目标流程对应的意图类别进行判断，解决了现有技术中引入目标流程不会出现的意图类别的技术问题，提高意图识别准确率。此外，由于采用类别表征数据库的形式存储流程对应的表征向量，所以在对流程或意图类别进行调整的时候，只需要修改相应的表征向量，解决了现有技术中需要重新训练一个综合意图识别模型的技术问题，减少运营维护成本，进一步提高意图识别准确率。

上述的非惯用的可选方式所具有的进一步效果将在下文中结合具体实施方式加以说明。

附图说明

附图用于更好地理解本发明，不构成对本发明的不当限定。其中：

图1是根据本发明实施例的意图识别方法的主要步骤的示意图；

图2是根据本发明实施例的生成意图类别对应的表征向量的方法的主要流程的示意图；

图3是根据本发明实施例的意图识别方法的主要流程的示意图；

图4是根据本发明实施例的意图识别装置的主要模块的示意图；

图5是本发明实施例可以应用于其中的示例性系统架构图；

图6是适于用来实现本发明实施例的终端设备或服务器的计算机系统的结构示意图。

具体实施方式

以下结合附图对本发明的示范性实施例做出说明，其中包括本发明实施例的各种细节以助于理解，应当将它们认为仅仅是示范性的。因此，本领域普通技术人员应当认识到，可以对这里描述的实施例做出各种改变和修改，而不会背离本发明的范围和精神。同样，为了清楚和简明，以下的描述中省略了对公知功能和结构的描述。

在实际的多流程业务场景中，每一轮对话可以看作为一个流程，通过多轮对话来实现业务，每个流程对应的意图类别是不同的，其中，意图类别是指对用户的意图进行分类，将相同的意图划分为一类。比如，疫情外呼系统包含确认用户身份、确认用户小区是否封闭、确认用户体温是否高于37.3℃这三个流程。确认用户身份流程是用于判断用户身份的，其对应的意图类别可以包括：用户身份确认、用户身份否定、用户意图不清晰等，如系统咨询用户是否是XXX，用户可以应答“是的”、“嗯”或者“我是”等，这些应答均可以归属为用户身份确认这个意图类别；对于确认用户小区是否封闭流程，其对应的意图类别可以包括：用户小区封闭和用户小区未封闭；对于确认用户体温是否高于37.3℃流程，其对应的意图类别可以包括：用户体温正常和用户体温不正常。对于多流程对话系统，现有的意图识别技术是对该系统业务覆盖的所有意图类别综合训练，得到一个综合意图识别模型，然后在每一个流程中，使用此综合意图识别模型进行意图识别。

但是，对于多流程对话系统，每一个流程对应的意图类别是所有意图类别的子集，因此在一个流程中，用综合意图识别模型去识别意图会带来额外的意图类别误差，也就是引入了此流程必然不会出现的意图类别。还有，在多流程的业务场景中，前序流程的意图识别错误，会对后续流程的应答造成影响。另外，现有技术训练的综合意图识别模型，全面覆盖所有意图。如果需要对意图进行调整、或者需要增加流程时，就需要重新训练一个综合意图识别模型，会导致模型越来越庞大，还需要运营的不断维护。

为了解决上述问题，本发明实施例提出了一种意图识别方法，图1是根据本发明实施例的意图识别方法的主要步骤的示意图。如图1所示，意图识别方法的主要步骤可以包括：

步骤S101，获取待识别语句对应的待识别文本向量和待识别语句对应的目标流程；

步骤S102，从类别表征数据库中，查询目标流程对应的至少一个目标表征向量，计算待识别文本向量与至少一个目标表征向量之间的文本距离；

步骤S103，基于计算的文本距离，根据至少一个目标表征向量，识别待识别语句对应的意图类别。

其中，待识别语句是需要进行意图识别的语句，可以是用户输入系统的语句，如用户与智能机器人的对话过程中，用户的提问咨询语句或者应答语句；待识别文本向量是指对待识别语句进行向量化处理，得到的文本向量。

本发明的可参考实施例中，在获取待识别语句后，可以利用Word2vec模型，将待识别语句进行向量化处理，得到待识别语句对应的待识别文本向量。Word2vec模型是一群用来产生词向量的相关模型，作用是将自然语言中的字词转为计算机可以理解的向量。具体的，获取到待识别语句，对该待识别语句进行分词处理；然后利用Word2vec模型对分词后的词语进行向量化处理，得到分词向量；最后可以将得到的分词向量进行求和或者其他处理，生成待识别文本向量。

目标流程是指该待识别语句所属的流程信息。对于多流程对话的业务场景，系统可以引导用户进行交流，因此预先配置该系统包含的流程信息。比如，对于疫情外呼系统，配置该系统包含确认用户身份、确认用户小区是否封闭、确认用户体温是否高于37.3℃这三个流程，且配置三个流程之间的跳转关系，该系统可以按照预先配置的流程信息，引导用户进行交流，首先跳转至确认用户身份的流程，对用户的输入语句进行意图识别，若意图识别结果为用户身份确认，则可以跳转至确认用户小区是否封闭的流程，若意图识别结果为用户身份否定，则可以直接退出。由于预先配置系统对应的流程信息，因此本发明的可参考实施例中，在得到待识别语句后，可以从配置的流程中，选择出该待识别语句对应的目标流程，也就是可以确定该待识别语句属于哪个流程。需要注意的是，配置的流程可以是由运行方根据系统对应的具体业务场景进行配置的，当然，后续也可以根据实际需求对配置的流程进行补充或者删除。

在确定待识别语句对应的目标流程后，以该目标流程为查询条件在类别表征数据库中进行查询，获取该目标流程对应的至少一个目标表征向量。其中，类别表征数据库是用于存储流程对应的表征向量的数据库，即在该数据库中存储各流程对应的表征向量。表征向量是用于表示意图类别的向量。对于一个流程，其对应一个或多个意图类别，如确认用户身份流程，其对应的意图类别可以包括：用户身份确认、用户身份否定、用户意图不清晰，可以用表征向量表示这些意图类别。因此，流程对应的表征向量是指流程包含的意图类别对应的表征向量，即类别表征数据库中存储意图类别对应的表征向量。所以，在确定目标流程后，查询目标流程对应的至少一个目标表征向量，相当于是查询到目标流程包含的意图类别对应的表征向量，即每个目标表征向量对应的意图类型是可以确定的。

在得知目标表征向量的情况下，可以计算待识别文本向量与目标表征向量之间的文本距离，由于目标向量的个数为至少一个，因此计算的文本距离是待识别文本向量与每个目标表征向量之间的文本距离。文本距离越小，说明两个向量之间的相似性越高，因此可以根据计算的文本距离，从目标表征向量中选择出待识别语句对应的意图表征向量，最后确定该意图表征向量对应的意图类别为待识别语句对应的意图类别。

根据本发明实施例的意图识别方法，首先获取待识别语句对应的目标流程，接着从类别表征数据库中查询到目标流程对应的目标表征向量，然后根据目标表征向量进行意图识别，能够实现仅对目标流程对应的意图类别进行判断，解决了现有技术中引入目标流程不会出现的意图类别的技术问题，提高意图识别准确率。此外，由于采用类别表征数据库的形式存储流程对应的表征向量，所以在对流程或意图类别进行调整的时候，只需要修改相应的表征向量，解决了现有技术中需要重新训练一个综合意图识别模型的技术问题，减少运营维护成本，进一步提高意图识别准确率。

在类别表征数据库中查询目标表征向量，从而可以利用目标表征向量进行意图识别，因此如何构建类别表征数据库是本发明实施例的意图识别方法的重要部分。接下来，具体描述类别表征数据库的构建过程。

本发明的可参考实施例中，意图识别方法还可以包括：获取配置的流程，确定配置的流程对应的至少一个意图类别，配置的流程的个数为至少一个；根据至少一个意图类别对应的原始语句，生成至少一个意图类别对应的表征向量，以得到配置的流程对应的表征向量；将配置的流程对应的表征向量加入类别表征数据库中，以构建类别表征数据库。

需要注意的是，预先配置系统包含的流程信息，该流程信息除了包括具体的流程名称、以及流程之间的跳转关系之外，还包括流程对应的意图类别。比如，对于疫情外呼系统，配置该系统包含确认用户身份、确认用户小区是否封闭、确认用户体温是否高于37.3℃这三个流程，配置三个流程之间的跳转关系，还分别配置了这三个流程对应的意图类别，如确认用户身份流程对应的意图类别可以包括：用户身份确认、用户身份否定、用户意图不清晰，确认用户小区是否封闭流程对应的意图类别可以包括：用户小区封闭、用户小区没有封闭，确认用户体温是否高于37.3℃流程对应的意图类别可以包括：用户体温正常、用户体温不正常。

在构建类别表征数据库的过程中，首先获取为系统配置的流程，且确定配置的流程对应的意图类别，然后生成配置的流程对应的表征向量。本发明实施例中，为系统配置的流程个数为一个或多个，每个流程对应至少一个意图类别，因此可以对每个流程对应的每个意图类别进行分析，生成可以表示该意图类别的表征向量，这样就可以得到每个流程对应的表征向量，最后将每个流程对应的表征向量加入类别表征数据库中。如，确认用户身份流程对应的意图类别可以包括：用户身份确认、用户身份否定、用户意图不清晰，生成用户身份确认、用户身份否定、用户意图不清晰这三个意图类别对应的表征向量，因此确认用户身份流程对应的表征向量为这三个意图类别对应的表征向量，采用同样的方法，可以生成确认用户小区是否封闭流程、以及确认用户体温是否高于37.3℃这两个流程对应的表征向量，将这三个流程对应的表征向量均加入类别表征数据库中，以完成疫情外呼系统(对于该系统包含确认用户身份、确认用户小区是否封闭、确认用户体温是否高于37.3℃这三个流程的情况下)对应的类别表征数据库的构建。

在意图识别方法中，可以对意图类别对应的原始语句进行处理，生成该意图类别对应的表征向量。作为本发明的可参考实施例，生成意图类别对应的表征向量的方法可以包括：针对一个意图类别，根据一个意图类别对应的原始语句，生成一个意图类别对应的训练文本向量；基于无监督聚类算法，将训练文本向量聚成至少一类，计算至少一类训练文本向量对应的表征向量；根据至少一类训练文本向量对应的表征向量，生成至少一个意图类别对应的表征向量。

首先，获取意图类别对应的原始语句，然后生成该意图类别对应的训练文本向量。原始语句可以是系统与用户之间的历史日志，如，“系统咨询：这里是XX疫情防控中心，请问您是XXX吗？用户应答：是我”。在获取到原始语句后，需要对其进行向量化处理，生成训练文本向量，具体的处理方法如下：获取一个意图类别对应的原始语句；采用同义词替换和/或翻译器回译的方式，对原始语句进行扩充，获得一个意图类别对应的训练语句；基于Word2vec模型和TF-IDF，对训练语句进行向量化处理，生成一个意图类别对应的训练文本向量。

为了扩大原始语句的数量，提高生成表征向量的准确性，在获取到意图类别对应的原始语句后，可以采用同义词替换和/或翻译器回译的方式，对原始语句进行扩充，得到由原始语句和扩充语句组成的训练语句。同义词替换是指用同义词替换语句中的部分词；翻译器回译是指先将语句翻译成其他语言，然后再翻译成与语句相同的语言，这样语句表述不同，但是其要表达的含义未改变。需要注意的是，对原始语句进行扩充的目的是提高生成的表征向量的准确性，如果意图类别对应的原始语句已经包含标准语句，比如用户身份确认这个意图类别，标准语句有：是我、对的、是、嗯嗯等。此时对原始语句进行扩充时，可以采用先将原始语句中的标准语句过滤掉，扩充完成后将标准语句加入，得到最后的训练语句，或者限制标准语句对应的扩充个数，这样可以避免标准语句的泛化问题，提高生成的表征向量的准确性。

在得到训练语句后，可以基于Word2vec模型和TF-IDF，对训练语句进行向量化处理，生成意图类别对应的训练文本向量，即用训练文本向量表示训练语句。上文已经介绍过Word2vec模型，其是一群用来产生词向量的相关模型，作用是将自然语言中的字词转为计算机可以理解的向量。TF-IDF，全称为Term Frequency-Inverse Document Frequency，即词频-逆文件频率，是一种用于资讯检索与资讯探勘的常用加权技术。TF-IDF是一种统计方法，用以评估一字词对于一个文件集或一个语料库中的其中一份文件的重要程度。字词的重要性随着它在文件中出现的次数成正比增加，但同时会随着它在语料库中出现的频率成反比下降。TF，全称为Term Frequency，即词频，指的是某一个给定的词语在该文件中出现的次数，这个数字通常会被归一化，以防止它偏向长的文件。考虑到一些通用的词语对于主题并没有太大的作用，反倒是一些出现频率较少的词才能够表达文章的主题，所以单纯使用是TF不合适的。权重的设计必须满足：一个词预测主题的能力越强，权重越大，反之，权重越小。所有统计的文章中，一些词只是在其中很少几篇文章中出现，那么这样的词对文章的主题的作用很大，这些词的权重应该设计的较大，IDF就是在完成这样的工作。IDF，全称为Inverse Document Frequency，即逆向文件频率，主要思想是：如果包含某词语的文档越少，在该词语的IDF越大，则说明该词语具有很好的类别区分能力。

利用Word2vec模型和TF-IDF对训练语句进行向量化处理，首先将该训练语句进行分词处理，得到该训练语句对应的至少一个训练分词；采用Word2vec模型对至少一个训练分词进行向量化处理，得到对应的训练分词向量；利用TF-IDF计算该训练语句对应的每个训练分词在该意图类别对应的所有训练分词中占的权重，即得到每个训练分词向量的权重；最后利用训练语句包含的训练分词向量和训练分词向量的权重，生成该训练语句对应的训练文本向量。

对一个意图类别对应的每个训练语句进行向量化处理，可以得到该意图类别对应的训练文本向量。接着，可以基于无监督聚类算法，将训练文本向量聚成至n类，n为大于等于1的整数，可以根据经验值设置。无监督聚类算法是指从给定的非标注数据进行模型的学习，输入数据没有被标记，无法预先知道样本的标签，只能从没有样本标签的样本集开始学习，发现这些非标注数据里面的数据结构和特征。采用无监督聚类算法可以将意图类别对应的训练文本向量分为n类，每类中的训练文本向量为相似性大的向量。n等于1表示将一个意图类别对应的训练文本向量聚成一类，用该类的中心向量作为该意图类别对应的表征向量；n大于1表示将一个意图类别对应的训练文本向量聚成多类，用多个类的中心向量作为该意图类别对应的表征向量，即一个意图类别对应的多个表征向量，这样的好处为可以使类别具有更强的泛化能力。中心向量是对每类中的训练文件向量进行求均值计算得到，该中心向量可以用于表示该类的特征。

综上所述，类别表征数据库中包括意图类别对应的表征向量，每个配置的流程对应一个或多个意图类别，因此类别表征数据库中包括每个配置的流程对应的表征向量，所以在多流程业务场景中，到达某流程时，可以利用该流程对应的意图类别进行意图识别，解决了现有技术中引入该流程不会出现的意图类别的技术问题，提高意图识别准确率。图2是根据本发明实施例的生成意图类别对应的表征向量的方法的主要流程的示意图。如图2所示，生成意图类别对应的表征向量的方法的主要流程可以包括：

步骤S201，获取意图类别对应的原始语句；

步骤S202，采用同义词替换和/或翻译器回译的方式，对原始语句进行扩充，获得该意图类别对应的训练语句；

步骤S203，基于Word2vec模型和TF-IDF，对训练语句进行向量化处理，生成该意图类别对应的训练文本向量；

步骤S204，基于无监督聚类算法，将训练文本向量聚成n类，计算每类训练文本向量对应的表征向量；

步骤S205，确定n类训练文本向量对应的表征向量为该意图类别对应的表征向量。

其中，n为大于等于1的正整数，可以根据经验设置。本发明实施例中，配置的流程的个数为至少一个，每个流程对应至少一个意图类别，因此可以利用上述步骤S201至步骤S205提供的生成意图类别对应的表征向量的方法生成每个意图类别对应的表征向量，进而得到每个流程对应的表征向量，将每个流程对应的表征向量加入类别表征数据库中，这样就可以完成类别表征数据库的构建。

可以发现，本发明实施例的类别表征数据库中包含每个配置的流程对应的表征向量，因此在需要对流程进行调整的时候，只需要对类别表征数据库中该流程对应的表征向量进行修改，解决了现有技术中在对流程进行调整时，需要重新旋律一个综合意图识别模型的技术问题，能够减少运营维护成本。

所以，作为本发明的可参考实施例，意图识别方法还可以包括：接收流程补充请求，将待补充流程添加至配置的流程中，生成待补充流程对应的表征向量，并将生成的表征向量加入类别表征数据库中；以及，接收流程删除请求，将待删除流程从配置的流程中删除，并将待删除流程对应的表征向量从类别表征数据库中删除。

在对系统设计的开始阶段，可以配置基本的流程，随着用户需求的不断增加，可能需要对之前配置的流程进行补充或者删除，此种情况下，只需要在类别表征数据库中添加待补充流程对应的表征向量或者从类别表征数据库中删除待删除流程对应的表征向量，就可以完成对类别表征数据库的更新，而不需要重新训练整体的综合意图识别模型，降低运营成本的同时，还可以提高意图识别的准确率。

类别表征数据库中包含每个配置的流程对应的表征向量，每个流程对应至少一个意图类别，实际上，类别表征数据库中存储的是每个意图类别对应的表征向量。所以在需要对意图类别进行调整的时候，只需要对类别表征数据库中该意图类别对应的表征向量进行修改，作为本发明的可参考实施例，意图识别方法还可以包括：接收意图类别补充请求，生成待补充意图类别对应的表征向量；确定待补充意图类别对应的流程，根据生成的表征向量更新确定的流程对应的表征向量，以更新类别表征数据库；以及，接收意图类别删除请求，将待删除意图类别对应的表征向量从类别表征数据库中删除。

现有技术中，如果需要添加意图类别或者删除意图类别，需要将新意图类别对应的语句加入到原始语料中或者将待删除意图类别对应的语句从原始语料中删除，然后重新训练一个综合意图识别模型，会造成不同流程的意图误差。但是，本发明实施例中，在需要添加意图类别时，将待补充意图类别添加至其对应的流程中，然后将待补充意图类别对应的表征向量加入类别表征数据库中；在需要删除意图类别时，将待删除意图类别从其对应的流程中删除，将待删除意图类别对应的表征向量从类别表征数据库中删除。因此，本发明实施例在需要添加意图类别或者删除意图类别时，不需要重新训练综合意图识别模型，减少运营维护成本，提高意图识别准确率。

意图识别方法中，利用步骤S101获取待识别语句对应的待识别文本向量和目标流程，利用步骤S102从类别表征数据库中查询到目标流程对应的目标表征向量，接着可以计算待识别文本向量与目标表征向量之间的文本距离，最后可以根据计算的文本距离，识别待识别语句对应的意图类别。

作为本发明的可参考实施例，基于计算的文本距离，根据至少一个目标表征向量，识别待识别语句对应的意图类别，可以包括：选择文本距离中的距离最小值，确定距离最小值对应的目标表征向量为待识别语句对应的意图表征向量；确定意图表征向量对应的意图类别为待识别语句对应的意图类别。

由于目标表征向量个数为至少一个，这样计算得到的文本距离为至少一个，考虑到文本距离越小，表示目标表征向量与待识别文本向量越相似，因此可以选择出文本距离中的距离最小值，认为距离最小值对应的目标表征向量为待识别语句对应的意图表征向量，最后可以确定意图表征向量对应的意图类别为待识别语句对应的意图类别。

本发明实施例中，除了通过距离最小值进行意图识别外，还可以采用如下方法进行意图识别：基于预设条件，从文本距离中选择距离值小的至少一个可选文本距离；根据至少一个可选文本距离对应的目标表征向量，确定至少一个可选文本距离对应的可选意图类别；选择出现次数值最多的可选意图类别为待识别语句对应的意图类别。

首先，从至少一个文本距离中选择出k个距离值小的文本距离，命名为可选文本距离。其中，预设条件中可以设置k的大小，比如预设条件为对文本距离按照从大到小进行排序，选择k个距离值较小的文本距离；预设条件中还可以设置可选文本距离的取值范围，进而选择出k个可选文本距离，比如设置选取距离值小于S的文本距离，这样就可以选择出k个文本距离。

在得到k个可选文本距离后，就可以确定这k个可选文本距离对应的目标表征向量，还可以确定出这k个目标表征向量分别对应哪个意图类别，将对应最多的意图类别确定为待识别语句对应的意图类别。比如，从类别表征数据库中选择出10个目标表征向量，计算得到10个文本距离，从这10个文本距离中选择出距离值小的4个可选文本距离s1、s2、s3和s4，得到对应的目标表征向量分别为m1、m2、m3和m4，确定m1、m2、m3和m4对应的可选意图类别分别为t1、t2、t1和t4，得到t1出现的次数最多，所以确定t1为待识别语句对应的意图类别。

图3是根据本发明实施例的意图识别方法的主要流程的示意图。如图3所示，意图识别方法的主要流程可以包括：

步骤S301，获取待识别语句；

步骤S302，利用Word2vec模型，将待识别语句进行向量化处理，得到待识别语句对应的待识别文本向量；

步骤S303，从配置的流程中，确定待识别语句对应的目标流程；

步骤S304，从类别表征数据库中，查询目标流程对应的至少一个目标表征向量，计算待识别文本向量与至少一个目标表征向量之间的文本距离；

步骤S305，选择文本距离中的距离最小值，确定距离最小值对应的目标表征向量为待识别语句对应的意图表征向量；

步骤S306，确定意图表征向量对应的意图类别为待识别语句对应的意图类别；

步骤S307，基于预设条件，从文本距离中选择距离值小的至少一个可选文本距离；

步骤S308，根据至少一个可选文本距离对应的目标表征向量，确定至少一个可选文本距离对应的可选意图类别；

步骤S309，选择出现次数值最多的可选意图类别为待识别语句对应的意图类别。

上述步骤S302和步骤S303的执行顺序可以根据实际情况进行调整，本发明实施例根据实际情况进行调整。步骤S304中的类别表征数据库可以通过上文描述的方法构建，此处不再累述。步骤S305至步骤306是通过距离最小值的方法进行意图识别的，步骤S307至步骤S309是通过意图类别次数出现多的方法进行意图识别的，本发明实施例中利用文本距离进行意图识别的方法中，可以通过步骤S305至步骤306实现，也可以执行步骤S307至步骤S309进行意图识别，对此不做限定。

本发明实施例的意图识别技术方案，首先获取待识别语句对应的目标流程，接着从类别表征数据库中查询到目标流程对应的目标表征向量，然后根据目标表征向量进行意图识别，能够实现仅对目标流程对应的意图类别进行判断，解决了现有技术中引入目标流程不会出现的意图类别的技术问题，提高意图识别准确率。此外，由于采用类别表征数据库的形式存储流程对应的表征向量，所以在对流程或意图类别进行调整的时候，只需要修改相应的表征向量，解决了现有技术中需要重新训练一个综合意图识别模型的技术问题，减少运营维护成本，进一步提高意图识别准确率。

图4是根据本发明实施例的意图识别装置的主要模块的示意图。如图4所示，意图识别装置400的主要模块可以包括：获取模块401、计算模块402和识别模块403。

其中，获取模块401可用于：获取待识别语句对应的待识别文本向量和待识别语句对应的目标流程；计算模块402可用于：从类别表征数据库中，查询目标流程对应的至少一个目标表征向量，计算待识别文本向量与至少一个目标表征向量之间的文本距离；识别模块403可用于：基于计算的文本距离，根据至少一个目标表征向量，识别待识别语句对应的意图类别。

本发明实施例中，计算模块402还可用于：获取配置的流程，确定配置的流程对应的至少一个意图类别，配置的流程的个数为至少一个；根据至少一个意图类别对应的原始语句，生成至少一个意图类别对应的表征向量，以得到配置的流程对应的表征向量；将配置的流程对应的表征向量加入类别表征数据库中，以构建类别表征数据库。

本发明实施例中，计算模块402还可用于：针对一个意图类别，根据一个意图类别对应的原始语句，生成一个意图类别对应的训练文本向量；基于无监督聚类算法，将训练文本向量聚成至少一类，计算至少一类训练文本向量对应的表征向量；根据至少一类训练文本向量对应的表征向量，生成至少一个意图类别对应的表征向量。

本发明实施例中，计算模块402还可用于：获取一个意图类别对应的原始语句；采用同义词替换和/或翻译器回译的方式，对原始语句进行扩充，获得一个意图类别对应的训练语句；基于Word2vec模型和TF-IDF，对训练语句进行向量化处理，生成一个意图类别对应的训练文本向量。

本发明实施例中，获取模块401还可用于：获取待识别语句；利用Word2vec模型，将待识别语句进行向量化处理，得到待识别语句对应的待识别文本向量；从配置的流程中，确定待识别语句对应的目标流程。

本发明实施例中，识别模块403还可用于：选择文本距离中的距离最小值，确定距离最小值对应的目标表征向量为待识别语句对应的意图表征向量；确定意图表征向量对应的意图类别为待识别语句对应的意图类别。

本发明实施例中，识别模块403还可用于：基于预设条件，从文本距离中选择距离值小的至少一个可选文本距离；根据至少一个可选文本距离对应的目标表征向量，确定至少一个可选文本距离对应的可选意图类别；选择出现次数值最多的可选意图类别为待识别语句对应的意图类别。

本发明实施例中，计算模块402还可用于：接收流程补充请求，将待补充流程添加至配置的流程中，生成待补充流程对应的表征向量，并将生成的表征向量加入类别表征数据库中；以及，接收流程删除请求，将待删除流程从配置的流程中删除，并将待删除流程对应的表征向量从类别表征数据库中删除。

本发明实施例中，计算模块402还可用于：接收意图类别补充请求，生成待补充意图类别对应的表征向量；确定待补充意图类别对应的流程，根据生成的表征向量更新确定的流程对应的表征向量，以更新类别表征数据库；以及，接收意图类别删除请求，将待删除意图类别对应的表征向量从类别表征数据库中删除。

从以上描述可以看出，本发明实施例的意图识别装置能够获取待识别语句对应的目标流程，接着从类别表征数据库中查询到目标流程对应的目标表征向量，然后根据目标表征向量进行意图识别，能够实现仅对目标流程对应的意图类别进行判断，解决了现有技术中引入目标流程不会出现的意图类别的技术问题，提高意图识别准确率。此外，由于采用类别表征数据库的形式存储流程对应的表征向量，所以在对流程或意图类别进行调整的时候，只需要修改相应的表征向量，解决了现有技术中需要重新训练一个综合意图识别模型的技术问题，减少运营维护成本，进一步提高意图识别准确率。

图5示出了可以应用本发明实施例的意图识别方法或意图识别装置的示例性系统架构500。

如图5所示，系统架构500可以包括终端设备501、502、503，网络504和服务器505。网络504用以在终端设备501、502、503和服务器505之间提供通信链路的介质。网络504可以包括各种连接类型，例如有线、无线通信链路或者光纤电缆等等。

用户可以使用终端设备501、502、503通过网络504与服务器505交互，以接收或发送消息等。终端设备501、502、503上可以安装有各种通讯客户端应用，例如购物类应用、网页浏览器应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等(仅为示例)。

终端设备501、502、503可以是具有显示屏并且支持网页浏览的各种电子设备，包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。

服务器505可以是提供各种服务的服务器，例如对用户利用终端设备501、502、503所浏览的购物类网站提供支持的后台管理服务器(仅为示例)。后台管理服务器可以对接收到的产品信息查询请求等数据进行分析等处理，并将处理结果(例如目标推送信息、产品信息--仅为示例)反馈给终端设备。

需要说明的是，本发明实施例所提供的意图识别方法一般由服务器505执行，相应地，意图识别装置一般设置于服务器505中。

应该理解，图5中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要，可以具有任意数目的终端设备、网络和服务器。

下面参考图6，其示出了适于用来实现本发明实施例的终端设备的计算机系统600的结构示意图。图6示出的终端设备仅仅是一个示例，不应对本发明实施例的功能和使用范围带来任何限制。

如图6所示，计算机系统600包括中央处理单元(CPU)601，其可以根据存储在只读存储器(ROM)602中的程序或者从存储部分608加载到随机访问存储器(RAM)603中的程序而执行各种适当的动作和处理。在RAM 603中，还存储有系统600操作所需的各种程序和数据。CPU 601、ROM 602以及RAM 603通过总线604彼此相连。输入/输出(I/O)接口605也连接至总线604。

以下部件连接至I/O接口605：包括键盘、鼠标等的输入部分606；包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分607；包括硬盘等的存储部分608；以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分609。通信部分609经由诸如因特网的网络执行通信处理。驱动器610也根据需要连接至I/O接口605。可拆卸介质611，诸如磁盘、光盘、磁光盘、半导体存储器等等，根据需要安装在驱动器610上，以便于从其上读出的计算机程序根据需要被安装入存储部分608。

特别地，根据本发明公开的实施例，上文参考流程图描述的过程可以被实现为计算机软件程序。例如，本发明公开的实施例包括一种计算机程序产品，其包括承载在计算机可读介质上的计算机程序，该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中，该计算机程序可以通过通信部分609从网络上被下载和安装，和/或从可拆卸介质611被安装。在该计算机程序被中央处理单元(CPU)601执行时，执行本发明的系统中限定的上述功能。

需要说明的是，本发明所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件，或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于：具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本发明中，计算机可读存储介质可以是任何包含或存储程序的有形介质，该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本发明中，计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号，其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式，包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质，该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输，包括但不限于：无线、电线、光缆、RF等等，或者上述的任意合适的组合。

附图中的流程图和框图，图示了按照本发明各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上，流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分，上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意，在有些作为替换的实现中，方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如，两个接连地表示的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这依所涉及的功能而定。也要注意的是，框图或流程图中的每个方框、以及框图或流程图中的方框的组合，可以用执行规定的功能或操作的专用的基于硬件的系统来实现，或者可以用专用硬件与计算机指令的组合来实现。

描述于本发明实施例中所涉及到的模块可以通过软件的方式实现，也可以通过硬件的方式来实现。所描述的模块也可以设置在处理器中，例如，可以描述为：一种处理器包括获取模块、计算模块和识别模块。其中，这些模块的名称在某种情况下并不构成对该模块本身的限定，例如，获取模块还可以被描述为“获取待识别语句对应的待识别文本向量和待识别语句对应的目标流程的模块”。

作为另一方面，本发明还提供了一种计算机可读介质，该计算机可读介质可以是上述实施例中描述的设备中所包含的；也可以是单独存在，而未装配入该设备中。上述计算机可读介质承载有一个或者多个程序，当上述一个或者多个程序被一个该设备执行时，使得该设备包括：获取待识别语句对应的待识别文本向量和待识别语句对应的目标流程；从类别表征数据库中，查询目标流程对应的至少一个目标表征向量，计算待识别文本向量与至少一个目标表征向量之间的文本距离；基于计算的文本距离，根据至少一个目标表征向量，识别待识别语句对应的意图类别。

根据本发明实施例的技术方案，获取待识别语句对应的目标流程，接着从类别表征数据库中查询到目标流程对应的目标表征向量，然后根据目标表征向量进行意图识别，能够实现仅对目标流程对应的意图类别进行判断，解决了现有技术中引入目标流程不会出现的意图类别的技术问题，提高意图识别准确率。此外，由于采用类别表征数据库的形式存储流程对应的表征向量，所以在对流程或意图类别进行调整的时候，只需要修改相应的表征向量，解决了现有技术中需要重新训练一个综合意图识别模型的技术问题，减少运营维护成本，进一步提高意图识别准确率。

上述具体实施方式，并不构成对本发明保护范围的限制。本领域技术人员应该明白的是，取决于设计要求和其他因素，可以发生各种各样的修改、组合、子组合和替代。任何在本发明的精神和原则之内所作的修改、等同替换和改进等，均应包含在本发明保护范围之内。

Claims

1.一种意图识别方法，其特征在于，包括：

获取待识别语句对应的待识别文本向量和所述待识别语句对应的目标流程；

从类别表征数据库中，查询所述目标流程对应的至少一个目标表征向量，计算所述待识别文本向量与所述至少一个目标表征向量之间的文本距离；

基于计算的文本距离，根据所述至少一个目标表征向量，识别所述待识别语句对应的意图类别。

2.根据权利要求1所述的方法，其特征在于，所述方法还包括：

获取配置的流程，确定所述配置的流程对应的至少一个意图类别，所述配置的流程的个数为至少一个；

根据所述至少一个意图类别对应的原始语句，生成所述至少一个意图类别对应的表征向量，以得到所述配置的流程对应的表征向量；

将所述配置的流程对应的表征向量加入所述类别表征数据库中，以构建所述类别表征数据库。

3.根据权利要求2所述的方法，其特征在于，根据所述至少一个意图类别对应的原始语句，生成所述至少一个意图类别对应的表征向量，包括：

针对一个意图类别，根据所述一个意图类别对应的原始语句，生成所述一个意图类别对应的训练文本向量；

基于无监督聚类算法，将所述训练文本向量聚成至少一类，计算至少一类训练文本向量对应的表征向量；

根据所述至少一类训练文本向量对应的表征向量，生成所述至少一个意图类别对应的表征向量。

4.根据权利要求3所述的方法，其特征在于，所述根据所述一个意图类别对应的原始语句，生成所述一个意图类别对应的训练文本向量，包括：

获取所述一个意图类别对应的原始语句；

采用同义词替换和/或翻译器回译的方式，对所述原始语句进行扩充，获得所述一个意图类别对应的训练语句；

基于Word2vec模型和TF-IDF，对所述训练语句进行向量化处理，生成所述一个意图类别对应的训练文本向量。

5.根据权利要求2所述的方法，其特征在于，所述获取待识别语句对应的待识别文本向量和所述待识别语句对应的目标流程，包括：

获取所述待识别语句；

利用Word2vec模型，将所述待识别语句进行向量化处理，得到所述待识别语句对应的待识别文本向量；

从所述配置的流程中，确定所述待识别语句对应的目标流程。

6.根据权利要求1所述的方法，其特征在于，所述基于计算的文本距离，根据所述至少一个目标表征向量，识别所述待识别语句对应的意图类别，包括：

选择所述文本距离中的距离最小值，确定所述距离最小值对应的目标表征向量为所述待识别语句对应的意图表征向量；

确定所述意图表征向量对应的意图类别为所述待识别语句对应的意图类别。

7.根据权利要求1所述的方法，其特征在于，所述基于计算的文本距离，根据所述至少一个目标表征向量，识别所述待识别语句对应的意图类别，包括：

基于预设条件，从所述文本距离中选择距离值小的至少一个可选文本距离；

根据所述至少一个可选文本距离对应的目标表征向量，确定所述至少一个可选文本距离对应的可选意图类别；

选择出现次数值最多的可选意图类别为所述待识别语句对应的意图类别。

8.根据权利要求2所述的方法，其特征在于，所述方法还包括：

接收流程补充请求，将待补充流程添加至所述配置的流程中，生成所述待补充流程对应的表征向量，并将生成的表征向量加入所述类别表征数据库中；以及，

接收流程删除请求，将待删除流程从所述配置的流程中删除，并将所述待删除流程对应的表征向量从所述类别表征数据库中删除。

9.根据权利要求2所述的方法，其特征在于，所述方法还包括：

接收意图类别补充请求，生成待补充意图类别对应的表征向量；

确定所述待补充意图类别对应的流程，根据生成的表征向量更新确定的流程对应的表征向量，以更新所述类别表征数据库；以及，

接收意图类别删除请求，将待删除意图类别对应的表征向量从所述类别表征数据库中删除。

10.一种意图识别装置，其特征在于，包括：

获取模块，用于获取待识别语句对应的待识别文本向量和所述待识别语句对应的目标流程；

计算模块，用于从类别表征数据库中，查询所述目标流程对应的至少一个目标表征向量，计算所述待识别文本向量与所述至少一个目标表征向量之间的文本距离；

识别模块，用于基于计算的文本距离，根据所述至少一个目标表征向量，识别所述待识别语句对应的意图类别。

11.一种电子设备，其特征在于，包括：

一个或多个处理器；

存储装置，用于存储一个或多个程序，

当所述一个或多个程序被所述一个或多个处理器执行，使得所述一个或多个处理器实现如权利要求1-9中任一所述的方法。

12.一种计算机可读介质，其上存储有计算机程序，其特征在于，所述程序被处理器执行时实现如权利要求1-9中任一所述的方法。