CN113094490B

CN113094490B - 一种会话交互方法、装置、电子设备及存储介质

Info

Publication number: CN113094490B
Application number: CN202110523489.0A
Authority: CN
Inventors: 杨森
Original assignee: Du Xiaoman Technology Beijing Co Ltd
Current assignee: Du Xiaoman Technology Beijing Co Ltd
Priority date: 2021-05-13
Filing date: 2021-05-13
Publication date: 2022-11-22
Anticipated expiration: 2041-05-13
Also published as: CN113094490A

Abstract

本申请提供了一种会话交互方法、装置、电子设备及存储介质，该方法中文本生成模型通过训练得到，不需要人工参与，可以保证在得到修改文本时，减少人力成本。并且，文本生成模型通过大量训练文本训练得到，可以保证生成的修改文本更加符合用户习惯，降低替换错误概率。以及，通过文本生成模型得到多个修改文本，可以避免每次回复均采用同一语言风格，保证回复的多样性，且从多个所述修改文本中确定出与所述目标会话回复风格匹配的目标修改文本，可以保证对同一用户进行回复时，风格的一致性。

Description

一种会话交互方法、装置、电子设备及存储介质

技术领域

本申请涉及智能对话技术领域，特别涉及一种会话交互方法、装置、电子设备及存储介质。

背景技术

在目前的智能对话系统中，主要采用以下方式回复用户：1.人工配置相同意思的多个语句，在回复时随机选择；2.配置语气词典，对机器人回复语句进行规则改写；3.通过文本生成模型，生成对应的回复语句。

但是，第一种方式存在人力成本高的问题，第二种方式存在生成结果生硬，替换错误概率高的问题，第三种方式均存在回复风格不可控的问题。

发明内容

本申请提供如下技术方案：

本申请一方面提供一种会话交互方法，应用于会话交互系统，该方法包括：

在接收到用户的会话信息的情况下，生成待回复文本，并确定与所述用户匹配的目标会话回复风格；

将所述待回复文本输入到文本生成模型，得到所述文本生成模型输出的多个修改文本，所述修改文本与所述待回复文本语义相同，且，语言风格具有差异；

从多个所述修改文本中确定出与所述目标会话回复风格匹配的目标修改文本，并向所述用户回复所述目标修改文本。

可选的，所述从多个所述修改文本中确定出与所述目标会话回复风格匹配的目标修改文本，包括：

分别将每个所述修改文本与所述待回复文本组成文本对，并将各个所述文本对输入到分类判别模型，获得所述分类判别模型输出的每个所述修改文本属于每个会话回复风格的概率；

基于每个所述修改文本属于每个会话回复风格的概率，确定每个所述修改文本属于所述目标会话回复风格的概率；

确定出多个所述修改文本属于所述目标会话回复风格的概率中的最大概率，并将所述最大概率对应的修改文本作为目标修改文本。

可选的，所述文本生成模型包括：unilm模型、SeqGan模型、Seq2Seq模型或GPT模型。

可选的，所述分类判别模型包括：第一embedding、第二embedding、第一dense、第二dense、第三dense和softmax函数；

所述第一embedding的输入端用于接收第一文本，所述第一embedding的输出端与所述第一dense的输入端相连，所述第一dense的输出端与所述第三dense的输入端相连；

所述第二embedding的输入端用于接收第二文本，所述第二embedding的输出端与所述第二dense的输入端相连，所述第二dense的输出端与所述第三dense的输入端相连；

所述第三dense的输出端与所述softmax函数的输入端相连；

所述将各个所述文本对输入到分类判别模型，获得所述分类判别模型输出的每个所述修改文本属于每个会话回复风格的概率，包括：

分别将各个所述文本对中的待回复文本输入到所述第一embedding的输入端，并分别将各个所述文本对中的修改文本输入到所述第二embedding的输入端，获得所述softmax函数输出的每个所述修改文本属于每个会话回复风格的概率。

可选的，所述文本生成模型的训练过程，包括：

获取标准回复训练文本及对所述标准回复训练文本进行修改得到的修改训练文本；

利用所述标准回复训练文本及所述修改训练文本，对文本生成模型进行训练，使所述文本生成模型输出的修改文本与输入的待回复文本的语义相同，且语言风格具有差异。

可选的，所述分类判别模型的训练过程，包括：

获取标准回复训练文本、对所述标准回复训练文本进行修改得到的修改训练文本及所述修改训练文本属于的会话回复风格；

利用所述标准回复训练文本、所述修改训练文本及所述修改训练文本属于的会话回复风格，对分类判别模型进行训练，使所述分类判别模型具备输出修改文本属于各个会话回复风格的概率的能力。

本申请的另一方面提供一种会话交互系统，包括：

第一生成模块，用于在接收到用户的会话信息的情况下，生成待回复文本；

第一确定模块，用于确定与所述与用户匹配的目标会话回复风格；

第二生成模块，用于将所述待回复文本输入到文本生成模型，得到所述文本生成模型输出的多个修改文本，所述修改文本与所述待回复文本语义相同，且，语言风格具有差异；

第二确定模块，用于从多个所述修改文本中确定出与所述目标会话回复风格匹配的目标修改文本；

回复模块，用于向所述用户回复所述目标修改文本。

可选的，所述第二确定模块，具体用于：

所述第三dense的输出端与所述softmax函数的输入端相连；

可选的，所述第二确定模块，具体用于：

可选的，所述系统还包括：文本生成模型训练模块，用于：

可选的，所述系统还包括：

本申请的第三方面提供一种电子设备，包括：

存储器和处理器；

存储器，用于至少存储一组指令集；

处理器，用于调用并执行所述存储器中的所述指令集，通过执行所述指令集进行以下处理：

本申请的第四方面提供一种存储介质，存储有实现如上述任意一项所述的会话交互方法的计算机程序，所述计算机程序被处理器执行，实现如上述任意一项所述的会话交互方法的各步骤。

与现有技术相比，本申请的有益效果为：

在本申请中，文本生成模型通过训练得到，不需要人工参与，可以保证在得到修改文本时，减少人力成本。并且，文本生成模型通过大量训练文本训练得到，可以保证生成的修改文本更加符合用户习惯，降低替换错误概率。以及，通过文本生成模型得到多个修改文本，可以避免每次回复均采用同一语言风格，保证回复的多样性，且从多个所述修改文本中确定出与所述目标会话回复风格匹配的目标修改文本，可以保证对同一用户进行回复时，风格的一致性。

附图说明

为了更清楚地说明本申请实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1是本申请实施例1提供的一种会话交互方法的流程示意图；

图2是本申请实施例2提供的一种会话交互方法的流程示意图；

图3是本申请实施例2提供的一种分类判别模型的结构示意图；

图4是本申请提供的一种会话交互系统的逻辑结构示意图；

图5是本申请提供的一种电子设备的结构示意图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

为了解决上述问题，本申请提供了一种会话交互方法，接下来对本申请提供的会话交互方法进行介绍。

参照图1，为本申请实施例1提供的一种会话交互方法的流程示意图，本申请提供的一种会话交互方法可以应用于会话交互系统，如图1所示，该方法可以包括但并不局限于以下步骤：

步骤S101、在接收到用户的会话信息的情况下，生成待回复文本，并确定与所述用户匹配的目标会话回复风格。

本实施例中，确定与所述用户匹配的目标会话回复风格，可以包括但不局限于：

获取所述用户的画像信息，根据所述用户的画像信息，确定会话回复风格，将确定的会话回复风格作为目标会话回复风格。

步骤S102、将所述待回复文本输入到文本生成模型，得到所述文本生成模型输出的多个修改文本，所述修改文本与所述待回复文本语义相同，且，语言风格具有差异。

将所述待回复文本输入到文本生成模型，得到所述文本生成模型输出的多个修改文本，可以避免每次回复均采用同一语言风格，保证回复的多样性。如，待回复文本为“你好是杨先生吗？”，修改文本为“你好，亲，请问你是杨先生吗？”。

本实施例中，所述文本生成模型的训练过程，可以包括：

S1021、获取标准回复训练文本及对所述标准回复训练文本进行修改得到的修改训练文本；

S1022、利用所述标准回复训练文本及所述修改训练文本，对文本生成模型进行训练，使所述文本生成模型输出的修改文本与输入的待回复文本的语义相同，且语言风格具有差异。

其中，所述文本生成模型可以包括但不局限于：unilm模型、SeqGan模型、Seq2Seq模型或GPT模型。

在文本生成模型为unilm模型的情况下，unilm模型可以通过但不局限于beamsearch算法、greedysearch或viterbi算法生成修改文本。

步骤S103、从多个所述修改文本中确定出与所述目标会话回复风格匹配的目标修改文本，并向所述用户回复所述目标修改文本。

本实施例中，可以对修改文本的语言风格进行分析，确定修改文本与目标会话回复风格的匹配程度，基于各个修改文本与目标会话回复风格的匹配程度，确定与目标会话回复风格匹配的目标修改文本。

作为本申请另一可选实施例，参照图2，为本申请实施例2提供的一种会话交互方法的流程示意图，本实施例主要是对上述实施例1描述的会话交互方法的细化方案，如图2所示，该方法可以包括但并不局限于以下步骤：

步骤S201、在接收到用户的会话信息的情况下，生成待回复文本，并确定与所述用户匹配的目标会话回复风格。

步骤S202、将所述待回复文本输入到文本生成模型，得到所述文本生成模型输出的多个修改文本，所述修改文本与所述待回复文本语义相同，且，语言风格具有差异。

步骤S201-S202的详细过程可以参见实施例1中步骤S101-S102的相关介绍，在此不再赘述。

步骤S203、分别将每个所述修改文本与所述待回复文本组成文本对，并将各个所述文本对输入到分类判别模型，获得所述分类判别模型输出的每个所述修改文本属于每个会话回复风格的概率。

本实施例中，所述分类判别模型的训练过程，可以包括：

S2031、获取标准回复训练文本、对所述标准回复训练文本进行修改得到的修改训练文本及所述修改训练文本属于的会话回复风格。

S2032、利用所述标准回复训练文本、所述修改训练文本及所述修改训练文本属于的会话回复风格，对分类判别模型进行训练，使所述分类判别模型具备输出修改文本属于各个会话回复风格的概率的能力。

如图3所示，分类判别模型可以包括但不局限于：第一embedding、第二embedding、第一dense、第二dense、第三dense和softmax函数。

所述第三dense的输出端与所述softmax函数的输入端相连。

第一embedding和第二embedding为不同的嵌入层，第一embedding和第二embedding分别用于向量表示文本信息。

第一dense、第二dense和第三dense为不同的全连接层，第一dense、第二dense和第三dense分别与上一层神经元每一个单元连接，用于减少特征位置对分类结果的影响。

softmax函数用于进行分类计算。

在应用分类判别模型时，第一文本可以为待回复文本，第二文本可以为修改文本。

与图3示出的分类判别模型的结构相对应，所述将各个所述文本对输入到分类判别模型，获得所述分类判别模型输出的每个所述修改文本属于每个会话回复风格的概率，可以包括：

步骤S204、基于每个所述修改文本属于每个会话回复风格的概率，确定每个所述修改文本属于所述目标会话回复风格的概率。

本实施例中，可以预先构建每个会话回复风格的标识，相应地，基于每个所述修改文本属于每个会话回复风格的概率，确定每个所述修改文本属于所述目标会话回复风格的概率，可以理解为：基于目标会话回复风格的标识，从每个所述修改文本属于每个会话回复风格的概率中，每个所述修改文本属于所述目标会话回复风格的概率。

可以理解的是，会话回复风格的标识可以为但不局限于：与会话回复风格匹配的修改人员的名称。

步骤S205、确定出多个所述修改文本属于所述目标会话回复风格的概率中的最大概率，并将所述最大概率对应的修改文本作为目标修改文本。

步骤S203-S205为实施例1中步骤S103的一种具体实施方式。

本实施例中，通过文本生成模型得到多个修改文本，可以避免每次回复均采用同一语言风格，保证回复的多样性，且，通过分类判别模型从多个所述修改文本中确定出与所述目标会话回复风格匹配的目标修改文本，保证对同一用户进行回复时，风格的一致性。

接下来对本申请提供的会话交互系统进行介绍，下文介绍的会话交互系统与上文介绍的会话交互方法可相互对应参照。

请参见图4，会话交互系统包括：第一生成模块100、第一确定模块200、第二生成模块300、第二确定模块400和回复模块500。

第一生成模块100，用于在接收到用户的会话信息的情况下，生成待回复文本；

第一确定模块200，用于确定与所述与用户匹配的目标会话回复风格；

第二生成模块300，用于将所述待回复文本输入到文本生成模型，得到所述文本生成模型输出的多个修改文本，所述修改文本与所述待回复文本语义相同，且，语言风格具有差异；

第二确定模块400，用于从多个所述修改文本中确定出与所述目标会话回复风格匹配的目标修改文本；

回复模块500，用于向所述用户回复所述目标修改文本。

本实施例中，所述第二确定模块400，具体可以用于：

本实施例中，所述文本生成模型可以包括：unilm模型、SeqGan模型、Seq2Seq模型或GPT模型。

本实施例中，所述分类判别模型可以包括：第一embedding、第二embedding、第一dense、第二dense、第三dense和softmax函数；

所述第三dense的输出端与所述softmax函数的输入端相连；

所述第二确定模块400，具体用于：

本实施例中，上述系统还可以包括：文本生成模型训练模块，用于：

本实施例中，上述系统还可以包括：

与上述本申请提供的一种会话交互方法实施例相对应的，本申请还提供了应用该会话交互方法的电子设备实施例。

如图5所示的为本申请提供的一种电子设备实施例1的结构示意图，该电子设备可以包括以下结构：

存储器10和处理器20。

存储器10，用于至少存储一组指令集；

处理器20，用于调用并执行所述存储器10中的所述指令集，通过执行所述指令集进行以下处理：

与上述本申请提供的一种会话交互方法实施例相对应的，本申请还提供了一种存储介质的实施例。

本实施例中，存储介质存储有实现如前述任意一个实施例所述的会话交互方法的计算机程序，所述计算机程序被处理器执行，实现如前述任意一个实施例所述的会话交互方法的各步骤。

需要说明的是，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似的部分互相参见即可。对于装置类实施例而言，由于其与方法实施例基本相似，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

最后，还需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

为了描述的方便，描述以上装置时以功能分为各种单元分别描述。当然，在实施本申请时可以把各单元的功能在同一个或多个软件和/或硬件中实现。

通过以上的实施方式的描述可知，本领域的技术人员可以清楚地了解到本申请可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品可以存储在存储介质中，如ROM/RAM、磁碟、光盘等，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本申请各个实施例或者实施例的某些部分所述的方法。

以上对本申请所提供的一种会话交互方法、装置、电子设备及存储介质进行了详细介绍，本文中应用了具体个例对本申请的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本申请的方法及其核心思想；同时，对于本领域的一般技术人员，依据本申请的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本申请的限制。

Claims

1.一种会话交互方法，其特征在于，应用于会话交互系统，该方法包括：

确定出多个所述修改文本属于所述目标会话回复风格的概率中的最大概率，并将所述最大概率对应的修改文本作为目标修改文本，并向所述用户回复所述目标修改文本。

2.根据权利要求1所述的方法，其特征在于，所述文本生成模型包括：unilm模型、SeqGan模型、Seq2Seq模型或GPT模型。

3.根据权利要求2所述的方法，其特征在于，所述分类判别模型包括：第一embedding、第二embedding、第一dense、第二dense、第三dense和softmax函数；

所述第三dense的输出端与所述softmax函数的输入端相连；

4.根据权利要求1所述的方法，其特征在于，所述文本生成模型的训练过程，包括：

5.根据权利要求1所述的方法，其特征在于，所述分类判别模型的训练过程，包括：

6.一种会话交互系统，其特征在于，包括：

第一确定模块，用于确定与所述用户匹配的目标会话回复风格；

回复模块，用于向所述用户回复所述目标修改文本；

所述第二确定模块，具体用于：

7.一种电子设备，包括：

存储器和处理器；

存储器，用于至少存储一组指令集；

8.一种存储介质，存储有实现如权利要求1-5任意一项所述的会话交互方法的计算机程序，所述计算机程序被处理器执行，实现如权利要求1-5任意一项所述的会话交互方法的各步骤。