CN117312666A

CN117312666A - 一种意图推荐方法、装置、电子设备及存储介质

Info

Publication number: CN117312666A
Application number: CN202311280766.5A
Authority: CN
Inventors: 董孝政; 毛腾
Original assignee: Lenovo Nuodi Beijing Intelligent Technology Co ltd
Current assignee: Lenovo Nuodi Beijing Intelligent Technology Co ltd
Priority date: 2023-09-28
Filing date: 2023-09-28
Publication date: 2023-12-29

Abstract

本申请提供了一种意图推荐方法、装置、电子设备及存储介质；所述方法包括：获得查询请求信息对应的第一推荐列表，所述第一推荐列表包括所述查询请求信息对应的至少一个相似问和所述至少一个相似问对应的意图；基于神经网络模型，确定所述第一推荐列表中的相似问对应的相似问特征；基于所述相似问特征，从所述第一推荐列表中确定满足推荐条件的与所述查询请求信息对应的多个目标意图。

Description

一种意图推荐方法、装置、电子设备及存储介质

技术领域

本申请涉及意图推荐技术，尤其涉及一种意图推荐方法、装置、电子设备及存储介质。

背景技术

现有的意图推荐方法，先确定推荐的意图数目的最大值，并确定意图的相似问与用户输入的查询请求信息的相似度，再通过设置相似度对应的阈值，筛选掉明显与查询请求信息不符的意图，最终推荐查询请求信息对应的固定数量的意图。现有的意图推荐方法，存在推荐的意图数目固定导致某些意图无法推荐，以及针对不同业务设置不同的阈值，在业务体系出现变化的情况下会导致意图推荐的准确度低的问题。

发明内容

本申请实施例提供了一种意图推荐方法、装置、电子设备及存储介质。

根据本申请的第一方面，提供了一种意图推荐方法，该方法包括：获得查询请求信息对应的第一推荐列表，所述第一推荐列表包括所述查询请求信息对应的至少一个相似问和所述至少一个相似问对应的意图；基于神经网络模型，确定所述第一推荐列表中的相似问对应的相似问特征；基于所述相似问特征，从所述第一推荐列表中确定满足推荐条件的与所述查询请求信息对应的多个目标意图。

根据本申请一实施方式，所述基于神经网络模型，确定所述第一推荐列表中的相似问对应的相似问特征，包括：将所述第一推荐列表包括的相似问及所述相似问与所述查询请求信息的相似度输入至所述神经网络模型；确定各个所述相似问对应的文本特征，并将所述文本特征与对应的所述相似度进行拼接，得到所述相似问特征。

根据本申请一实施方式，所述基于所述相似问特征，从所述第一推荐列表中确定满足推荐条件的与所述查询请求信息对应的多个目标意图，包括：基于所述神经网络模型的模型参数，确定所述相似问特征对应的推荐条件；所述推荐条件包括相似问的概率分布；响应于所述相似问特征满足所述推荐条件，将所述第一推荐列表中对应的多个相似问确定为第一相似问；将多个所述第一相似问对应的意图确定为多个所述目标意图；按照所述相似度由大到小的顺序，将多个所述目标意图依次输出至目标推荐列表。

根据本申请一实施方式，所述将多个所述目标意图依次输出至目标推荐列表之后，所述方法还包括：响应于用户针对所述目标推荐列表的触控操作，将所述触控操作对应的意图确定为选定意图；基于所述选定意图和多个所述目标意图的数量，确定所述目标推荐列表对应的奖励分数；基于所述奖励分数，调整所述神经网络模型的模型参数；所述模型参数用于确定所述相似问特征对应的推荐条件。

根据本申请一实施方式，所述基于所述选定意图和多个所述目标意图的数量，确定所述目标推荐列表对应的奖励分数，包括：响应于所述目标推荐列表存在所述选定意图，确定所述选定意图在所述目标推荐列表的排列次序，并基于多个所述目标意图的数量和所述排列次序，确定所述目标推荐列表对应的奖励分数；响应于所述目标推荐列表不存在所述选定意图，确定所述目标推荐列表对应的奖励分数为指定值。

根据本申请一实施方式，所述获得查询请求信息对应的第一推荐列表，包括：基于所述查询请求信息的查询关键字，确定所述查询关键字对应的相似问，每个所述相似问对应至少一个意图；确定所述相似问与所述意图查询信息之间的相似度；按照所述相似度由大到小的顺序，对所述相似问进行排序，得到第一推荐列表。

根据本申请一实施方式，所述方法还包括：获得训练请求信息对应的训练推荐列表，所述训练推荐列表包括所述训练请求信息对应的至少一个相似问和所述至少一个相似问对应的意图；基于待训练模型，确定所述训练推荐列表中的相似问对应的相似问特征；基于所述相似问特征，从所述训练推荐列表中确定满足训练推荐条件的与所述训练请求信息对应的多个训练目标意图；按照所述相似问与所述训练请求信息的相似度由大到小的顺序，将多个所述训练目标意图依次输出至训练目标推荐列表，并将所述训练目标推荐列表中的至少一个训练目标意图确定为训练选定意图；基于所述训练选定意图和所述训练目标意图的数量，确定所述训练目标推荐列表对应的训练奖励分数；基于所述训练奖励分数，调整所述待训练模型的训练参数，得到所述神经网络模型，所述训练参数用于确定所述相似问特征对应的训练推荐条件。

根据本申请的第二方面，提供了一种意图推荐装置，该意图推荐装置包括：获取模块，用于获得查询请求信息对应的第一推荐列表，所述第一推荐列表包括所述查询请求信息对应的至少一个相似问和所述至少一个相似问对应的意图；确定模块，用于基于神经网络模型，确定所述第一推荐列表中的相似问对应的相似问特征；推荐模块，用于基于所述相似问特征，从所述第一推荐列表中确定满足推荐条件的与所述查询请求信息对应的多个目标意图。

根据本申请的第三方面，提供了一种电子设备，包括：

至少一个处理器；以及

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行本申请所述的方法。

根据本申请的第四方面，提供了一种存储有计算机指令的非瞬时计算机可读存储介质，所述计算机指令用于使所述计算机执行本申请所述的方法。

附图说明

通过参考附图阅读下文的详细描述，本申请示例性实施方式的上述以及其他目的、特征和优点将变得易于理解。在附图中，以示例性而非限制性的方式示出了本申请的若干实施方式，其中：

在附图中，相同或对应的标号表示相同或对应的部分。

图1示出了本申请实施例提供的意图推荐方法的处理流程示意图；

图2示出了本申请第二实施例提供的意图推荐方法的流程示意图；

图3示出了本申请第三实施例提供的意图推荐方法的流程示意图；

图4示出了本申请第四实施例提供的意图推荐方法的流程示意图；

图5示出了本申请第五实施例提供的意图推荐方法的流程示意图；

图6示出了本申请第六实施例提供的意图推荐方法的流程示意图；

图7示出了本申请第七实施例提供的意图推荐方法的流程示意图；

图8示出了本申请实施例提供的意图推荐方法的一种应用场景图；

图9示出了本申请实施例提供的意图推荐方法的另一种应用场景图；

图10示出了本申请实施例提供的意图推荐装置的一种可选示意图；

图11示出了本申请实施例提供的电子设备的组成结构示意图。

具体实施方式

为使本申请的目的、特征、优点能够更加的明显和易懂，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分实施例，而非全部实施例。基于本申请中的实施例，本领域技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

在以下的描述中，涉及到“一些实施例”，其描述了所有可能实施例的子集，但是可以理解，“一些实施例”可以是所有可能实施例的相同子集或不同子集，并且可以在不冲突的情况下相互结合。

在以下的描述中，所涉及的术语“第一\第二”仅仅是区别类似的对象，不代表针对对象的特定排序，可以理解地，“第一\第二”在允许的情况下可以互换特定的顺序或先后次序，以使这里描述的本申请实施例能够以除了在这里图示或描述的以外的顺序实施。

除非另有定义，本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同。本文中所使用的术语只是为了描述本申请实施例的目的，不是旨在限制本申请。

对本申请实施例提供的意图推荐方法中的处理流程进行说明。参见图1，图1是本申请实施例提供的意图推荐方法的处理流程示意图，将结合图1示出的步骤S101-S103进行说明。

步骤S101，获得查询请求信息对应的第一推荐列表。

在一些实施例中，第一推荐列表可以包括查询请求信息对应的至少一个相似问和至少一个相似问对应的意图。相似问可以包括：类似于查询请求信息的问题，这种问题通常涉及到类似于已有的概念、模式、规律或类比关系等。查询请求信息可以为用户输入的query(查询)请求语句。查询请求信息可以包括查询关键字。相似问可以根据查询关键字，从预先构建的相似问库中检索得到。相似问库中的相似问可以对应至少一个意图。第一推荐列表可以按照相似问与查询请求信息的由大到小的顺序，对所述相似问进行排序得到。第一推荐列表中的相似问可以对应至少一个意图，且第一推荐列表中的相似问按照相似度由大到小的顺序存储。

步骤S102，基于神经网络模型，确定第一推荐列表中的相似问对应的相似问特征。

在一些实施例中，神经网络模型可以包括残差网络、卷积神经网络、循环神经网络等。本申请实施例不限定具体的神经网络模型。神经网络模型为经过训练后的神经网络模型。神经网络模型的输入为第一推荐列表。神经网络模型的输出为满足推荐条件的与查询请求信息对应的多个目标意图。相似问特征可以包括：文本特征与相似问与查询请求信息的相似度拼接后的组合特征。文本特征可以通过神经网络模型对第一推荐列表中的相似问进行文本特征提取得到。相似问特征可以通过将文本特征与相似问与查询请求信息的相似度进行拼接得到。

步骤S103，基于相似问特征，从第一推荐列表中确定满足推荐条件的与查询请求信息对应的多个目标意图。

在一些实施例中，推荐条件可以通过神经网络模型的模型参数确定。推荐条件可以包括相似问的概率分布。推荐条件还可以包括其他条件，本申请实施例不限定具体的推荐条件。目标意图可以包括相似问特征满足推荐条件的相似问对应的意图。目标意图的数量不是固定的，目标意图的数量由神经网络模型的输出决定。本申请实施例不限定具体的目标意图的数量。例如，通过神经网络模型确定第一推荐列表中满足推荐条件的与查询请求信息对应有4个目标意图，则神经网络模型输出这4个目标意图。

针对步骤S101-S103，在具体实施时，可以包括：获得查询请求信息对应的第一推荐列表，将第一推荐列表输入神经网络模型，基于神经网络模型，确定第一推荐列表中的相似问对应的相似问特征。基于相似问特征，从第一推荐列表中确定相似问特征满足推荐条件的与查询请求信息对应的多个目标意图。

本申请实施例的方法，通过步骤S101-S103，根据查询语句对应的相似问的特征确定进行推荐的目标意图，能够自动将与查询语句相关的意图进行筛选并精确推荐多个目标意图，提高了意图推荐的精度。通过设定目标意图对应目标推荐列表的奖励函数，对神经网络模型实时优化，针对不同业务无需重新设置不同的阈值，在业务体系出现变化的情况下能够通过神经网络自动确定变化后业务体系下进行推荐的多个目标意图，提高了意图推荐的准确度和灵活性，降低了意图推荐方法实施的成本。

对本申请实施例提供的意图推荐方法中的具体处理流程进行说明。参见图2，图2示出了本申请第二实施例提供的意图推荐方法的流程示意图。

如图2所示，步骤S101中的获得查询请求信息对应的第一推荐列表，包括：

步骤S201，基于查询请求信息的查询关键字，确定查询关键字对应的相似问。

在本实施例中，从用户输入的query请求语句中，确定出该query请求语句的查询关键字。将查询关键词与相似问库中的每个相似问进行特征匹配，得到查询关键字对应的相似问。其中，查询关键字可以包括查询请求信息的特征向量。

步骤S202，确定相似问与意图查询信息之间的相似度。

在本实施例中，计算相似问与查询关键字之间的样本距离，根据样本距离确定相似问与意图查询信息之间的相似度。其中，相似度可以为分值。例如，以0-1之间的数值表示相似度，1表示相似问与意图查询信息之间的相似度最大，0表示相似问与意图查询信息之间的相似度最小。样本距离可以包括欧式距离、马氏距离和夹角余弦等。本申请实施例不限定具体的样本距离。

步骤S203，按照相似度由大到小的顺序，对相似问进行排序，得到第一推荐列表。

作为示例，将查询请求信息的查询关键字1与相似问库中的每个相似问进行特征匹配，得到查询关键字1对应的相似问包括：相似问a、相似问b和相似问c。计算相似问a与查询关键字1之间的样本距离1，根据样本距离1确定相似问a与意图查询信息之间的相似度为0.9。同理，确定相似问b与意图查询信息之间的相似度为0.91。确定相似问c与意图查询信息之间的相似度为0.87。按照相似度由大到小的顺序，对相似问a、相似问b和相似问c进行排序，得到①相似问b、②相似问a、③相似问c的相似问序列。按照相似问序列依次将相似问和相似问对应的意图输出至推荐列表，得到第一推荐列表。

本申请实施例的方法，通过步骤S201-S203，根据查询语句对应的相似问的特征确定进行推荐的目标意图，能够自动将与查询语句相关的意图进行筛选并精确推荐多个目标意图，提高了意图推荐的精度。通过设定目标意图对应目标推荐列表的奖励函数，对神经网络模型实时优化，针对不同业务无需重新设置不同的阈值，在业务体系出现变化的情况下能够通过神经网络自动确定变化后业务体系下进行推荐的多个目标意图，提高了意图推荐的准确度和灵活性，降低了意图推荐方法实施的成本。

对本申请实施例提供的意图推荐方法中的具体处理流程进行说明。参见图3，图3示出了本申请第三实施例提供的意图推荐方法的流程示意图。

如图3所示，步骤S102中的基于神经网络模型，确定第一推荐列表中的相似问对应的相似问特征，包括：

步骤S301，将第一推荐列表包括的相似问及相似问与查询请求信息的相似度输入至神经网络模型。

步骤S302，确定各个相似问对应的文本特征，并将文本特征与对应的相似度进行拼接，得到相似问特征。

在本实施例中，通过神经网络模型，对第一推荐列表中的相似问进行文本特征提取，得到各个相似问对应的文本特征。将文本特征与对应的相似度进行拼接，得到相似问特征。

进一步地，还可以确定各个相似问对应的各个相似度之间的相似度特征。将文本特征、相似问对应的相似度以及相似度特征进行拼接，得到相似问特征。其中，相似度特征可以包括：相似度与相似度平均值的差值、相似度与相似度最大值的差值、相似度与相似度最小值的差值。

本申请实施例的方法，通过步骤S301-S302，根据查询语句对应的相似问的特征确定进行推荐的目标意图，能够自动将与查询语句相关的意图进行筛选并精确推荐多个目标意图，提高了意图推荐的精度。通过设定目标意图对应目标推荐列表的奖励函数，对神经网络模型实时优化，针对不同业务无需重新设置不同的阈值，在业务体系出现变化的情况下能够通过神经网络自动确定变化后业务体系下进行推荐的多个目标意图，提高了意图推荐的准确度和灵活性，降低了意图推荐方法实施的成本。

对本申请实施例提供的意图推荐方法中的具体处理流程进行说明。参见图4，图4示出了本申请第四实施例提供的意图推荐方法的流程示意图。

如图4所示，步骤S103中的基于相似问特征，从第一推荐列表中确定满足推荐条件的与查询请求信息对应的多个目标意图，包括：

步骤S401，基于神经网络模型的模型参数，确定相似问特征对应的推荐条件。

在本实施例中，确定最近一次迭代的神经网络模型的模型参数，然后将模型参数输入神经网络模型中进行前向传播，得到推荐条件。其中，模型参数可以包括：学习率、权重参数、梯度参数、损失函数等。本申请实施例不限定具体的模型参数。推荐条件可以包括相似问的概率分布。推荐条件还可以包括其他相似问特征对应的条件。本申请实施例不限定具体的推荐条件。

作为示例，将模型参数输入训练好的神经网络模型中进行前向传播，得到相似度概率分布。模型根据概率分布输出一个或多个相似度得分。

步骤S402，响应于相似问特征满足推荐条件，将第一推荐列表中对应的多个相似问确定为第一相似问。

在本实施例中，判断相似问特征是否满足相似问的概率分布，若相似问特征满足相似问的概率分布，将第一推荐列表中对应的多个相似问确定为第一相似问。其中，第一相似问可以包括：第一推荐列表中相似问特征满足推荐条件对应的相似问。判断相似问特征是否满足推荐条件可以包括：根据每个相似问特征在所有相似问表示中的权重，确定相似问特征是否满足相似问的概率分布。

步骤S403，将多个第一相似问对应的意图确定为多个目标意图。

步骤S404，按照相似度由大到小的顺序，将多个目标意图依次输出至目标推荐列表。

作为示例，将第一推荐列表中对应的相似问1确定为第一相似问1，将第一推荐列表中对应的相似问2确定为第一相似问2。相似问1可以对应意图a。相似问2可以对应意图b。相似问a与查询请求信息的相似度为0.88，相似问b与查询请求信息的相似度为0.90。将意图a确定为目标意图a，将意图b确定为目标意图b。按照相似度由大到小的顺序，将目标意图a和目标意图b依次输出至目标推荐列表。目标推荐列表中可以包括：①意图b、②意图a。

本申请实施例的方法，通过步骤S401-S403，根据查询语句对应的相似问的特征确定进行推荐的目标意图，能够自动将与查询语句相关的意图进行筛选并精确推荐多个目标意图，提高了意图推荐的精度。通过设定目标意图对应目标推荐列表的奖励函数，对神经网络模型实时优化，针对不同业务无需重新设置不同的阈值，在业务体系出现变化的情况下能够通过神经网络自动确定变化后业务体系下进行推荐的多个目标意图，提高了意图推荐的准确度和灵活性，降低了意图推荐方法实施的成本。

对本申请实施例提供的意图推荐方法中的具体处理流程进行说明。参见图5，图5示出了本申请第五实施例提供的意图推荐方法的流程示意图。

如图5所示，步骤S103中的基于相似问特征，从第一推荐列表中确定满足推荐条件的与查询请求信息对应的多个目标意图之后，意图推荐方法还包括：

步骤S501，响应于用户针对目标推荐列表的触控操作，将触控操作对应的意图确定为选定意图。

步骤S502，基于选定意图和多个目标意图的数量，确定目标推荐列表对应的奖励分数。

在本实施例中，用户针对目标推荐列表的触控操作可以包括：用户选中目标推荐列表中的任一目标意图。若目标推荐列表中仅存在一个目标意图，且目标意图为选定意图，则确定目标推荐列表对应的奖励分数最大。若目标推荐列表不存在选定意图，确定目标推荐列表对应的奖励分数最小。若目标推荐列表中存在多个目标意图，则响应于目标推荐列表存在选定意图，确定选定意图在目标推荐列表的排列次序，并基于多个目标意图的数量和排列次序，确定目标推荐列表对应的奖励分数，在这种情况下的目标推荐列表对应的奖励分数在最大值与最小值之间。

步骤S503，基于奖励分数，调整神经网络模型的模型参数。

在本实施例中，模型参数用于确定相似问特征对应的推荐条件。模型参数可以包括：学习率、权重参数、梯度参数、损失函数等。本申请实施例不限定具体的模型参数。通过反向传播算法基于奖励分数能够对神经网络模型的模型参数进行调整。具体来说，通过对神经网络模型的模型参数进行梯度下降优化，使得神经网络模型输出的目标推荐列表与用户的选定意图之间的误差最小化。奖励分数还可以用于指导模型参数的调整方向。通过Policy Gradient(策略梯度)方法基于奖励分数也能够对神经网络模型的模型参数进行调整。本申请实施例不限定具体的调整神经网络模型的模型参数的方法。

本申请实施例的方法，通过步骤S501-S503，根据查询语句对应的相似问的特征确定进行推荐的目标意图，能够自动将与查询语句相关的意图进行筛选并精确推荐多个目标意图，提高了意图推荐的精度。通过设定目标意图对应目标推荐列表的奖励函数，对神经网络模型实时优化，针对不同业务无需重新设置不同的阈值，在业务体系出现变化的情况下能够通过神经网络自动确定变化后业务体系下进行推荐的多个目标意图，提高了意图推荐的准确度和灵活性，降低了意图推荐方法实施的成本。

对本申请实施例提供的意图推荐方法中的具体处理流程进行说明。参见图6，图6示出了本申请第六实施例提供的意图推荐方法的流程示意图。

如图6所示，步骤S502中的基于选定意图和多个目标意图的数量，确定目标推荐列表对应的奖励分数，包括：

步骤S601，响应于目标推荐列表存在选定意图，确定选定意图在目标推荐列表的排列次序，并基于多个目标意图的数量和排列次序，确定目标推荐列表对应的奖励分数。

在本实施例中，目标推荐列表中仅存在一个目标意图，响应于目标推荐列表存在选定意图，确定选定意图在目标推荐列表的排列次序为1，基于目标意图的数量1和排列次序1，确定目标推荐列表对应的奖励分数为2。在这种情况下，目标推荐列表对应的奖励分数最大。

在本实施例中，目标推荐列表中存在多个目标意图，响应于目标推荐列表存在选定意图，确定选定意图在目标推荐列表的排列次序，并基于多个目标意图的数量和排列次序，确定目标推荐列表对应的奖励分数reward，可以通过下述公式(1)表示：

reward ＝ 1- (n-k)/n*δ (1)

其中，n为多个目标意图的数量，k为排列次序，δ为常量。

作为示例，目标推荐列表a中存在4个目标意图，响应于目标推荐列表存在选定意图，确定选定意图在目标推荐列表的排在第2个，δ为1，通过公式(1)，确定目标推荐列表a对应的奖励分数reward为0.5。

步骤S602，响应于目标推荐列表不存在选定意图，确定目标推荐列表对应的奖励分数为指定值。

在本实施例中，指定值可以包括负奖励分数。例如，响应于目标推荐列表不存在选定意图，确定目标推荐列表对应的奖励分数为-1。本申请实施例不限定具体的指定值。在这种情况下，目标推荐列表对应的奖励分数最小。

本申请实施例的方法，通过步骤S601-S602，根据查询语句对应的相似问的特征确定进行推荐的目标意图，能够自动将与查询语句相关的意图进行筛选并精确推荐多个目标意图，提高了意图推荐的精度。通过设定目标意图对应目标推荐列表的奖励函数，对神经网络模型实时优化，针对不同业务无需重新设置不同的阈值，在业务体系出现变化的情况下能够通过神经网络自动确定变化后业务体系下进行推荐的多个目标意图，提高了意图推荐的准确度和灵活性，降低了意图推荐方法实施的成本。

对本申请实施例提供的意图推荐方法中的具体处理流程进行说明。参见图7，图7示出了本申请第七实施例提供的意图推荐方法的流程示意图。

如图7所示，步骤S102中的神经网络模型的训练过程，包括：

步骤S701，获得训练请求信息对应的训练推荐列表，训练推荐列表包括训练请求信息对应的至少一个相似问和至少一个相似问对应的意图。

在本实施例中，从训练请求信息中，确定出该训练请求信息的查询关键字。将查询关键词与相似问库中的每个相似问进行特征匹配，得到查询关键字对应的相似问。计算相似问与查询关键字之间的样本距离，根据样本距离确定相似问与意图查询信息之间的相似度。按照相似度由大到小的顺序，得到相似问的相似问序列。按照相似问序列依次将相似问和相似问对应的意图输出至推荐列表，得到训练推荐列表。

步骤S702，基于待训练模型，确定训练推荐列表中的相似问对应的相似问特征。

步骤S703，基于相似问特征，从训练推荐列表中确定满足训练推荐条件的与训练请求信息对应的多个训练目标意图。

在本实施例中，通过待训练模型，对训练推荐列表中的相似问进行文本特征提取，得到各个相似问对应的文本特征。将文本特征与对应的相似度进行拼接，得到相似问特征。确定待训练模型的模型参数，然后将模型参数输入待训练模型中进行前向传播，得到训练推荐条件。判断相似问特征是否满足训练推荐条件，若相似问特征满足训练推荐条件，将训练推荐列表中对应的多个相似问确定为第一相似问。将多个第一相似问对应的意图确定为多个训练目标意图。

步骤S704，按照相似问与训练请求信息的相似度由大到小的顺序，将多个训练目标意图依次输出至训练目标推荐列表，并将训练目标推荐列表中的至少一个训练目标意图确定为训练选定意图。

步骤S705，基于训练选定意图和训练目标意图的数量，确定训练目标推荐列表对应的训练奖励分数。

在本实施例中，按照相似问与训练请求信息的相似度由大到小的顺序，将多个训练目标意图依次输出至训练目标推荐列表。通过选定指令选中目标推荐列表中的目标意图，确定为训练选定意图。选定指令可以包括：随机选中训练目标推荐列表中的训练目标意图、选中目标推荐列表中的指定的一个训练目标意图和选中目标推荐列表中的指定的多个训练目标意图。本申请实施例不限定选定指令的选定的训练目标意图。

若训练目标推荐列表中仅存在一个训练目标意图，且训练目标意图为训练选定意图，则确定训练目标推荐列表对应的训练奖励分数最大。若训练目标推荐列表不存在训练选定意图，确定训练目标推荐列表对应的训练奖励分数最小。若训练目标推荐列表中存在多个训练目标意图，则响应于训练目标推荐列表存在训练选定意图，确定训练选定意图在训练目标推荐列表的排列次序，并基于多个训练目标意图的数量和排列次序，确定训练目标推荐列表对应的训练奖励分数，在这种情况下的训练目标推荐列表对应的训练奖励分数在最大值与最小值之间。

步骤S706，基于训练奖励分数，调整待训练模型的训练参数，得到神经网络模型。

在本实施例中，通过Policy Gradient方法基于训练奖励分数对待训练模型的模型参数进行调整，直至模型参数中的损失函数收敛，得到神经网络模型。

本申请实施例的方法，通过步骤S701-S706，根据查询语句对应的相似问的特征确定进行推荐的目标意图，能够自动将与查询语句相关的意图进行筛选并精确推荐多个目标意图，提高了意图推荐的精度。通过设定目标意图对应目标推荐列表的奖励函数，对神经网络模型实时优化，针对不同业务无需重新设置不同的阈值，在业务体系出现变化的情况下能够通过神经网络自动确定变化后业务体系下进行推荐的多个目标意图，提高了意图推荐的准确度和灵活性，降低了意图推荐方法实施的成本。

参考图8，本申请实施例提供的意图推荐方法的一种应用场景图，应用于获得查询请求信息对应的第一推荐列表的过程。首先，获取用户输入的查询请求信息。根据检索模块，从用户输入的查询请求信息中，确定出该查询请求信息的查询关键字。将查询关键词与相似问库中的每个相似问进行特征匹配，得到查询关键字对应的相似问1、相似问2……相似问m。m为正整数。本申请实施例不限定m的具体数目。计算相似问1、相似问2……相似问m分别与查询关键字之间的样本距离，根据各个样本距离确定相似问1、相似问2……相似问m分别与意图查询信息之间的相似度1、相似度2……相似度m。其中，相似度可以为分值。

排序模块，按照相似度1、相似度2……相似度m由大到小的顺序，对相似问1、相似问2……相似问m进行排序，得到相似问序列。按照相似问序列依次将相似问和相似问对应的意图输出至推荐列表，得到第一推荐列表。

参考图9，本申请实施例提供的意图推荐方法的另一种应用场景图，应用于意图推荐方法的意图推荐网络模型结构。意图推荐网络模型结构可以包括：Embedding Layer(嵌入层)、Network Layer(网络层)和Classification Layer(分类输出层)。其中，网络层可以包括多个网络层。网络层的数量N为正整数，本申请实施例不限定具体的网络层的数量。意图推荐网络模型的输入可以包括多个相似问、多个相似问对应的意图，多个相似问分别与查询请求信息的相似度。意图推荐网络模型的输出可以包括：多个目标意图，目标意图可以为在多个相似问中，相似问特征满足推荐条件的与查询请求信息对应的意图。

可以理解，图8、图9的意图推荐方法的应用场景只是本申请实施例中的部分示例性的实施方式，本申请实施例中意图推荐方法的应用场景包括但不限于图8、图9所示的意图推荐方法的应用场景。

下面继续说明本申请实施例提供的意图推荐装置90的实施为软件模块的示例性结构，在一些实施例中，如图10所示，获取模块901，可以用于获得查询请求信息对应的第一推荐列表，第一推荐列表包括查询请求信息对应的至少一个相似问和至少一个相似问对应的意图；确定模块902，可以用于基于神经网络模型，确定第一推荐列表中的相似问对应的相似问特征；推荐模块903，可以用于基于相似问特征，从第一推荐列表中确定满足推荐条件的与查询请求信息对应的多个目标意图。

需要说明的是，本申请实施例装置的描述，与上述方法实施例的描述是类似的，具有同方法实施例相似的有益效果，因此不做赘述。对于本申请实施例提供的意图推荐装置中未尽的技术细节，可以根据图1至图9中任一附图的说明而理解。

根据本申请的实施例，本申请还提供了一种电子设备和一种非瞬时计算机可读存储介质。

图11示出了可以用来实施本申请的实施例的示例电子设备800的示意性框图。电子设备旨在表示各种形式的数字计算机，诸如，膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置，诸如，个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例，并且不意在限制本文中描述的和/或者要求的本申请的实现。

如图11所示，电子设备800包括计算单元801，其可以根据存储在只读存储器(ROM)802中的计算机程序或者从存储单元808加载到随机访问存储器(RAM)803中的计算机程序，来执行各种适当的动作和处理。在RAM 803中，还可存储电子设备800操作所需的各种程序和数据。计算单元801、ROM 802以及RAM 803通过总线804彼此相连。输入/输出(I/O)接口805也连接至总线804。

电子设备800中的多个部件连接至I/O接口805，包括：输入单元806，例如键盘、鼠标等；输出单元807，例如各种类型的显示器、扬声器等；存储单元808，例如磁盘、光盘等；以及通信单元809，例如网卡、调制解调器、无线通信收发机等。通信单元809允许电子设备800通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。

计算单元801可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元801的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元801执行上文所描述的各个方法和处理，例如意图推荐方法。例如，在一些实施例中，意图推荐方法可被实现为计算机软件程序，其被有形地包含于机器可读介质，例如存储单元808。在一些实施例中，计算机程序的部分或者全部可以经由ROM 802和/或通信单元809而被载入和/或安装到电子设备800上。当计算机程序加载到RAM 803并由计算单元801执行时，可以执行上文描述的意图推荐方法的一个或多个步骤。备选地，在其他实施例中，计算单元801可以通过其他任何适当的方式(例如，借助于固件)而被配置为执行意图推荐方法。

本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、负载可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括：实施在一个或者多个计算机程序中，该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释，该可编程处理器可以是专用或者通用可编程处理器，可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令，并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。

用于实施本申请的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器，使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行，作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。

在本申请的上下文中，机器可读介质可以是有形的介质，其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备，或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。

为了提供与用户的交互，可以在计算机上实施此处描述的系统和技术，该计算机具有：用于向用户显示信息的显示装置(例如，CRT(阴极射线管)或者LCD(液晶显示器)监视器)；以及键盘和指向装置(例如，鼠标或者轨迹球)，用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互；例如，提供给用户的反馈可以是任何形式的传感反馈(例如，视觉反馈、听觉反馈、或者触觉反馈)；并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。

可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如，作为数据服务器)、或者包括中间件部件的计算系统(例如，应用服务器)、或者包括前端部件的计算系统(例如，具有图形用户界面或者网络浏览器的用户计算机，用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如，通信网络)来将系统的部件相互连接。通信网络的示例包括：局域网(LAN)、广域网(WAN)和互联网。

计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器，也可以为分布式系统的服务器，或者是结合了区块链的服务器。

应该理解，可以使用上面所示的各种形式的流程，重新排序、增加或删除步骤。例如，本公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行，只要能够实现本申请公开的技术方案所期望的结果，本文在此不进行限制。

此外，术语“第一”、“第二”仅用于描述目的，而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此，限定有“第一”、“第二”的特征可以明示或隐含地包括至少一个该特征。在本申请的描述中，“多个”的含义是两个或两个以上，除非另有明确具体的限定。

以上所述，仅为本申请的具体实施方式，但本申请的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本申请揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本申请的保护范围之内。因此，本申请的保护范围应以所述权利要求的保护范围为准。

Claims

1.一种意图推荐方法，包括：

获得查询请求信息对应的第一推荐列表，所述第一推荐列表包括所述查询请求信息对应的至少一个相似问和所述至少一个相似问对应的意图；

基于神经网络模型，确定所述第一推荐列表中的相似问对应的相似问特征；

基于所述相似问特征，从所述第一推荐列表中确定满足推荐条件的与所述查询请求信息对应的多个目标意图。

2.根据权利要求1所述的方法，所述基于神经网络模型，确定所述第一推荐列表中的相似问对应的相似问特征，包括：

将所述第一推荐列表包括的相似问及所述相似问与所述查询请求信息的相似度输入至所述神经网络模型；

确定各个所述相似问对应的文本特征，并将所述文本特征与对应的所述相似度进行拼接，得到所述相似问特征。

3.根据权利要求2所述的方法，所述基于所述相似问特征，从所述第一推荐列表中确定满足推荐条件的与所述查询请求信息对应的多个目标意图，包括：

基于所述神经网络模型的模型参数，确定所述相似问特征对应的推荐条件；所述推荐条件包括相似问的概率分布；

响应于所述相似问特征满足所述推荐条件，将所述第一推荐列表中对应的多个相似问确定为第一相似问；

将多个所述第一相似问对应的意图确定为多个所述目标意图；

按照所述相似度由大到小的顺序，将多个所述目标意图依次输出至目标推荐列表。

4.根据权利要求3所述的方法，所述将多个所述目标意图依次输出至目标推荐列表之后，所述方法还包括：

响应于用户针对所述目标推荐列表的触控操作，将所述触控操作对应的意图确定为选定意图；

基于所述选定意图和多个所述目标意图的数量，确定所述目标推荐列表对应的奖励分数；

基于所述奖励分数，调整所述神经网络模型的模型参数；所述模型参数用于确定所述相似问特征对应的推荐条件。

5.根据权利要求4所述的方法，所述基于所述选定意图和多个所述目标意图的数量，确定所述目标推荐列表对应的奖励分数，包括：

响应于所述目标推荐列表存在所述选定意图，确定所述选定意图在所述目标推荐列表的排列次序，并基于多个所述目标意图的数量和所述排列次序，确定所述目标推荐列表对应的奖励分数；

响应于所述目标推荐列表不存在所述选定意图，确定所述目标推荐列表对应的奖励分数为指定值。

6.根据权利要求1所述的方法，所述获得查询请求信息对应的第一推荐列表，包括：

基于所述查询请求信息的查询关键字，确定所述查询关键字对应的相似问，每个所述相似问对应至少一个意图；

确定所述相似问与所述意图查询信息之间的相似度；

按照所述相似度由大到小的顺序，对所述相似问进行排序，得到第一推荐列表。

7.根据权利要求1所述的方法，所述方法还包括：

获得训练请求信息对应的训练推荐列表，所述训练推荐列表包括所述训练请求信息对应的至少一个相似问和所述至少一个相似问对应的意图；

基于待训练模型，确定所述训练推荐列表中的相似问对应的相似问特征；

基于所述相似问特征，从所述训练推荐列表中确定满足训练推荐条件的与所述训练请求信息对应的多个训练目标意图；

按照所述相似问与所述训练请求信息的相似度由大到小的顺序，将多个所述训练目标意图依次输出至训练目标推荐列表，并将所述训练目标推荐列表中的至少一个训练目标意图确定为训练选定意图；

基于所述训练选定意图和所述训练目标意图的数量，确定所述训练目标推荐列表对应的训练奖励分数；

基于所述训练奖励分数，调整所述待训练模型的训练参数，得到所述神经网络模型，所述训练参数用于确定所述相似问特征对应的训练推荐条件。

8.一种意图推荐装置，包括：

获取模块，用于获得查询请求信息对应的第一推荐列表，所述第一推荐列表包括所述查询请求信息对应的至少一个相似问和所述至少一个相似问对应的意图；

确定模块，用于基于神经网络模型，确定所述第一推荐列表中的相似问对应的相似问特征；

推荐模块，用于基于所述相似问特征，从所述第一推荐列表中确定满足推荐条件的与所述查询请求信息对应的多个目标意图。

9.一种电子设备，其特征在于，包括：

至少一个处理器；以及

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行权利要求1-7中任一项所述的方法。

10.一种存储有计算机指令的非瞬时计算机可读存储介质，其特征在于，所述计算机指令用于使计算机执行根据权利要求1-7中任一项所述的方法。