CN112445906A

CN112445906A - 一种生成回复消息的方法及装置

Info

Publication number: CN112445906A
Application number: CN201910803233.8A
Authority: CN
Inventors: 黄海兵; 邱晓杰
Original assignee: Beijing Sogou Technology Development Co Ltd
Current assignee: Beijing Sogou Technology Development Co Ltd
Priority date: 2019-08-28
Filing date: 2019-08-28
Publication date: 2021-03-05

Abstract

本申请实施例公开了一种生成回复消息的方法及装置，输入法客户端在获取到目标上文信息之后，先将目标上文信息输入到预先训练的对话模型中对当前用户的回复内容进行预测，再根据对话模型的输出结果确定目标上文信息对应的至少一个回复语料，并将至少一个回复语料作为候选项进行显示，以便后续当前用户能够利用显示的候选项进行回复。可见，在本申请实施例提供的方法中，输入法客户端能够根据目标上文信息并利用对话模型准确地预测出该目标上文信息中的目标问题对应的回复语料，使得当前用户可以直接利用作为候选项的回复语料对目标用户进行回复即可，无需当前用户自己编辑内容进行回复。

Description

一种生成回复消息的方法及装置

技术领域

本申请涉及互联网技术领域，具体涉及一种生成回复消息的方法及装置。

背景技术

随着终端设备的普及，用户可以借助终端设备与其他用户进行聊天。例如，当第一用户和第二用户聊天时，第一用户的终端设备接收并显示第二用户发送的聊天内容(例如，“我要睡觉了”)，以便第一用户能够借助终端设备针对第二用户发送的聊天内容进行回复(例如，“晚安，好梦”)。在现有技术中，通常由用户自己编辑内容进行回复。然而，在实际应用中，针对一些相似或相同的问题，用户通常会利用相同内容进行回复，如此导致在接收到多个相似或相同的问题时，用户需要多次重复地编辑相同内容进行回复，从而导致用户时间的浪费。

发明内容

有鉴于此，本申请实施例提供一种生成回复消息的方法及装置，以解决现有技术中在接收到多个相似或相同的问题时用户需要多次重复地编辑相同内容进行回复的技术问题。

为解决上述问题，本申请实施例提供的技术方案如下：

在本申请实施例第一方面，提供了一种生成回复消息的方法，所述方法包括：

获取目标上文信息，所述目标上文信息包括目标用户提出的目标问题、所述目标问题之前的对话上文以及所述目标用户的用户标识；

将所述目标上文信息输入预先训练的对话模型，根据所述对话模型的输出结果确定所述目标上文信息对应的至少一个回复语料；所述对话模型是根据历史上文信息以及所述历史上文信息对应的历史回复训练得到的，所述历史上文信息包括历史用户提出的历史问题，所述历史问题之前的对话上文以及所述历史用户的用户标识；

将所述至少一个回复语料作为候选项显示。

在一种可能的实施方式中，所述将所述目标上文信息输入预先训练的对话模型，包括：

将所述目标上文信息中的目标用户提出的目标问题、所述目标问题之前的对话上文以及所述目标用户的用户标识分别转换为文本向量；

将转换得到的所述目标上文信息对应的文本向量输入预先训练的对话模型，所述对话模型用于将转换得到的所述目标上文信息对应的文本向量进行拼接得到第一隐藏层特征，将所述第一隐藏层特征进行全连接生成针对所述目标问题的各个候选答案的评分值。

在一种可能的实施方式中，所述根据所述对话模型的输出结果确定所述目标上文信息对应的至少一个回复语料，包括：

获得所述对话模型输出的针对所述目标问题的各个候选答案的评分值，选择所述评分值最高的至少一个候选答案作为所述目标上文信息对应的至少一个回复语料。

在一种可能的实施方式中，所述目标用户的用户标识为当前用户对所述目标用户的备注名称或者所述目标用户的用户名。

在一种可能的实施方式中，所述方法还包括：

获取历史上文信息以及所述历史上文信息对应的历史回复；

将所述历史上文信息输入初始对话模型，以在所述初始对话模型输出的针对所述历史问题的各个候选答案的评分值中，所述历史上文信息对应的历史回复的评分值最高作为训练目标，训练生成所述对话模型。

在一种可能的实施方式中，所述将所述历史上文信息输入初始对话模型，包括：

将所述历史上文信息中的历史用户提出的历史问题、所述历史问题之前的对话上文以及所述历史用户的用户标识分别转换为文本向量；

将转换得到的所述历史上文信息对应的文本向量输入初始对话模型，所述初始对话模型用于将转换得到的所述历史上文信息对应的文本向量进行拼接得到第二隐藏层特征，将所述第二隐藏层特征进行全连接生成针对所述历史问题的各个候选答案的评分值。

在一种可能的实施方式中，所述历史用户的用户标识为回复所述历史回复的用户对所述历史用户的备注名称或者所述历史用户的用户名。

在本申请实施例第二方面，提供了一种生成回复消息的装置，所述装置包括：

第一获取单元，用于获取目标上文信息，所述目标上文信息包括目标用户提出的目标问题、所述目标问题之前的对话上文以及所述目标用户的用户标识；

回复预测单元，用于将所述目标上文信息输入预先训练的对话模型，根据所述对话模型的输出结果确定所述目标上文信息对应的至少一个回复语料；所述对话模型是根据历史上文信息以及所述历史上文信息对应的历史回复训练得到的，所述历史上文信息包括历史用户提出的历史问题，所述历史问题之前的对话上文以及所述历史用户的用户标识；

回复显示单元，用于将所述至少一个回复语料作为候选项显示。

在一种可能的实施方式中，所述回复预测单元，包括：

第一转换子单元，用于将所述目标上文信息中的目标用户提出的目标问题、所述目标问题之前的对话上文以及所述目标用户的用户标识分别转换为文本向量；

第一输入子单元，用于将转换得到的所述目标上文信息对应的文本向量输入预先训练的对话模型，所述对话模型用于将转换得到的所述目标上文信息对应的文本向量进行拼接得到第一隐藏层特征，将所述第一隐藏层特征进行全连接生成针对所述目标问题的各个候选答案的评分值。

在一种可能的实施方式中，所述回复预测单元，包括：

回复选择子单元，用于获得所述对话模型输出的针对所述目标问题的各个候选答案的评分值，选择所述评分值最高的至少一个候选答案作为所述目标上文信息对应的至少一个回复语料。

在一种可能的实施方式中，所述装置还包括：

第二获取单元，用于获取历史上文信息以及所述历史上文信息对应的历史回复；

模型训练单元，用于将所述历史上文信息输入初始对话模型，以在所述初始对话模型输出的针对所述历史问题的各个候选答案的评分值中，所述历史上文信息对应的历史回复的评分值最高作为训练目标，训练生成所述对话模型。

在一种可能的实施方式中，所述模型训练单元，包括：

第二转换子单元，用于将所述历史上文信息中的历史用户提出的历史问题、所述历史问题之前的对话上文以及所述历史用户的用户标识分别转换为文本向量；

第二输入子单元，用于将转换得到的所述历史上文信息对应的文本向量输入初始对话模型，所述初始对话模型用于将转换得到的所述历史上文信息对应的文本向量进行拼接得到第二隐藏层特征，将所述第二隐藏层特征进行全连接生成针对所述历史问题的各个候选答案的评分值。

在本申请实施例第二方面，提供了一种用于生成回复消息的装置，包括有存储器，以及一个或者一个以上的程序，其中一个或者一个以上程序存储于存储器中，且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令：

将所述至少一个回复语料作为候选项显示。

在本申请实施例第二方面，提供了一种计算机可读介质，其上存储有指令，当由一个或多个处理器执行时，使得装置执行上述提供的一个或多个所述的生成回复消息的方法。

由此可见，本申请实施例具有如下有益效果：

本申请实施例提供的生成回复消息的方法中，输入法客户端在获取到目标上文信息之后，先将目标上文信息输入到预先训练的对话模型中对当前用户的回复内容进行预测，再根据对话模型的输出结果确定目标上文信息对应的至少一个回复语料，并将至少一个回复语料作为候选项进行显示，以便后续当前用户能够利用显示的候选项进行回复。可见，在本申请实施例提供的方法中，输入法客户端能够根据目标上文信息并利用对话模型准确地预测出作为候选项的回复语料，使得当前用户可以直接利用该作为候选项的回复语料进行回复即可，无需当前用户自己编辑内容进行回复。另外，由于目标上文信息不仅包括目标用户提出的目标问题，还包括目标问题之前的对话上文和目标用户的用户标识，因而，利用对话模型预测得到的作为候选项的回复语料不仅能够表示出对目标问题的回复内容，还能够表示出当前用户回复目标用户时所采用的回复语气，使得该作为候选项的回复语料能够符合该目标用户的身份特点，从而实现针对具有不同身份特点的目标用户给出具有不同语气的回复。

附图说明

图1为本申请实施例提供的示例性应用场景的框架示意图；

图2为本申请实施例提供的生成回复消息的方法流程图；

图3为本申请实施例提供的第一种聊天场景示意图；

图4为本申请实施例提供的第二种聊天场景示意图；

图5为本申请实施例提供的候选项的显示示意图；

图6为本申请实施例提供的候选项的选择示意图；

图7为本申请实施例提供的利用对话模型进行预测的流程图；

图8为本申请实施例提供的对话模型的训练流程图；

图9为本申请实施例提供的利用初始对话模型进行预测的流程图；

图10为本申请实施例提供的生成回复消息的装置结构示意图；

图11为本申请实施例提供的一种输入装置的结构示意图；

图12为本申请实施例提供的一种服务器设备的结构示意图。

具体实施方式

为使本申请的上述目的、特征和优点能够更加明显易懂，下面结合附图和具体实施方式对本申请实施例作进一步详细的说明。

为便于理解本申请提供的技术方案，下面将先对本申请的背景技术进行说明。

发明人在对传统的聊天回复方案研究中发现，在传统的聊天回复方案中，针对聊天对象多次发送的一些相似或相同的问题，用户通常会利用相同内容进行回复，如此导致在接收到多个相似或相同的问题时，用户需要多次重复地编辑相同内容进行回复，从而导致用户时间的浪费。例如，当第一个聊天对象至第十个聊天对象均向用户发送了“我要睡觉了”时，用户需要自己编辑十次“祝你好梦，晚安”分别回复第一个聊天对象至第十个聊天对象，如此导致用户时间的浪费。

另外，发明人通过对不同用户之间的聊天过程进行详细研究，进一步发现：对于具有不同身份特点的聊天对象，用户通常会采用不同的回复语气进行回复；而且，对于具有相同身份特点的聊天对象，用户通常会采用相同的回复语气进行回复。也就是说，当多个具有不同身份特点的聊天对象均向用户发送相似或相同的问题时，用户会根据用户的身份特点确定回复语气，以便利用该回复语气回复对应的聊天对象。例如，假设第一个聊天对象的身份是好兄弟，第二个聊天对象的身份是女朋友，第三个聊天对象的身份是同事。基于该假设，当第一个聊天对象至第三个聊天对象均向用户发送“我要睡觉了”的内容时，用户需要编辑“睡啥睡，再开一局”回复第一个聊天对象，用户需要编辑“晚安，宝贝”回复第二个聊天对象，用户需要编辑“晚安，好梦”回复第三个聊天对象，如此导致在接收到多个相似或相同的问题时，用户需要编辑不同的内容回复具有不同身份特点的聊天对象，以便使得聊天对象收到的回复内容更符合该聊天对象与用户之间的关系特点。如此导致用户需要耗费较多的时间针对不同身份特点进行不同回复。

基于此，本申请实施例提供了一种生成回复消息的方法，具体为：在获取到目标上文信息之后，将目标上文信息输入预先训练的对话模型，以便根据对话模型的输出结果确定目标上文信息对应的至少一个回复语料，并将至少一个回复语料作为候选项进行显示。可见，该方法能够根据目标上文信息并利用对话模型准确地预测出作为候选项的回复语料，并将该作为候选项的回复语料直接显示给用户，使得用户能够直接利用显示的作为候选项的回复语料进行回复即可，无需用户自己编辑回复内容，节省用户时间。另外，该方法还能够根据目标上文信息中所携带的目标用户的用户标识确定聊天对象的身份特点，并能够利用对话模型预测得到能够符合该目标用户的身份特点的作为候选项的回复语料，并将该作为候选项的回复语料直接显示给用户，使得用户能够直接利用显示的作为候选项的回复语料进行回复即可，无需用户自己依据聊天对象的身份特点编辑回复内容，节省用户时间；而且，还实现针对具有不同身份特点的目标用户给出不同语气的回复，且针对具有相同或相似身份特点的目标用户给出相同语气的回复。

为便于理解本申请实施例提供的生成回复消息的方法，下面先结合图1所示的应用场景进行解释和说明。其中，图1为本申请实施例提供的示例性应用场景的框架示意图。

如图1所示，本申请实施例提供的生成回复消息的方法可以应用于输入法客户端11。此时，输入法客户端11在获取到目标上文信息之后，将目标上文信息输入预先训练的对话模型，以便根据对话模型的输出结果确定目标上文信息对应的至少一个回复语料，并将至少一个回复语料作为候选项进行显示。也就是，输入法客户端11能够根据目标上文信息中携带的目标用户提出的目标问题、目标问题之前的对话上文以及目标用户的用户标识，利用对话模型准确地预测得到能够符合目标用户身份特点的作为候选项的回复语料作为候选项的回复语料，并向输入法客户端11的使用用户(也就是，当前用户)显示该作为候选项的回复语料，以便后续当前用户能够直接利用显示的作为候选项的回复语料向目标用户进行回复。

需要说明的是，将目标上文信息输入预先训练的对话模型，并根据对话模型的输出结果确定该目标上文信息对应的至少一个回复语料的操作，既可以由输入法客户端11自身利用预先训练的对话模型对目标上文信息进行预测得到至少一个回复语料；也可以由输入法客户端11将目标上文信息发送给对应的输入法服务器12，以便输入法服务器12利用预先训练的对话模型对目标上文信息进行预测得到至少一个回复语料，使得输入法客户端11可以从输入法服务器12获取该至少一个回复语料；也可以由输入法客户端11将目标上文信息发送给其它客户端或设备，以便其它客户端或设备利用预先训练的对话模型对目标上文信息进行预测得到至少一个回复语料，使得输入法客户端11可以从其它客户端或设备获取该至少一个回复语料。其中，其它客户端可以为不同于输入法客户端的客户端，其它设备可以为不同于输入法服务器12独立存在的设备，可以为现有、正在研发的或将来研发的、能够利用预先训练的对话模型进行回复语料预测的设备。

本领域技术人员可以理解，图1所示的框架示意图仅是本申请的实施方式可以在其中得以实现的一个示例。本申请实施方式的适用范围不受到该框架任何方面的限制。

需要注意的是，客户端11可以承载于终端，该终端可以是现有的、正在研发的或将来研发的、能够通过任何形式的有线和/或无线连接(例如，Wi-Fi、LAN、蜂窝、同轴电缆等)相互交互的任何用户设备，包括但不限于：现有的、正在研发的或将来研发的智能可穿戴设备、智能手机、非智能手机、平板电脑、膝上型个人计算机、桌面型个人计算机、小型计算机、中型计算机、大型计算机等。本申请的实施方式在此方面不受任何限制。还需要注意的是，本申请实施例中服务器12可以是现有的、正在研发的或将来研发的、能够利用预先训练的对话模型进行回复语料预测的设备的一个示例。本申请的实施方式在此方面不受任何限制。

为便于理解本申请实施例提供的技术方案，下面将结合附图对本申请实施例提供的生成回复消息的方法进行说明。

参见图2，该图为本申请实施例提供的生成回复消息的方法流程图。如图2所示，该方法可以包括步骤S21-S23：

S21：获取目标上文信息，该目标上文信息包括目标用户提出的目标问题、该目标问题之前的对话上文以及该目标用户的用户标识。

其中，目标用户是指向当前用户发送目标问题的用户，且为当前用户的聊天对象。其中，当前用户是指需要针对目标问题进行回复的用户。例如，假设用户A与用户B聊天，则当用户A向用户B发送“我要睡觉了”时，则用户B是当前用户，且用户A为目标用户。

需要说明的是，当前用户和目标用户是一对相对性概念，不是绝对的概念，其具体为：当前用户是指目标问题的回复者，且目标用户是指目标问题的提出者(或发送者)。例如，假设用户A与用户B聊天，当用户A向用户B发送目标问题时，则用户B是当前用户，且用户A为目标用户；当用户B向用户A发送目标问题时，则用户A是当前用户，且用户B为目标用户。

目标问题是指由目标用户向当前用户发送的聊天内容。例如，当用户B是当前用户，用户A为目标用户，且用户A向用户B发送“我要睡觉了”的内容时，则内容“我要睡觉了”为目标问题。

需要说明的是，本申请实施例不限定目标问题的具体内容，目标问题可以包括任一种聊天内容，例如，目标问题可以包括疑问句、陈述句、祈使句等。另外，本申请实施例也不限定目标问题的显示形式，目标问题可以是语音形式、文本形式、图片形式、视频形式等显示形式。

目标问题之前的对话上文是指在目标用户发送目标问题之前的聊天记录。例如，如图3所示，当目标问题是“我要睡觉了”时，则目标问题之前的对话上文可以包括“宝贝，干啥呢”、“追剧哦”、“那宝贝看剧吧，我玩游戏去了”、“去吧去吧”等内容。另外，在本申请实施例中，目标问题之前的对话上文能够记录在当前用户与目标用户的聊天过程中，当前用户回复目标用户所使用的语气信息，使得目标问题之前的对话上文能够反映目标用户的身份特点。

需要说明的是，本申请实施例不限定对话上文的内容范围，该对话上位可以包括目标问题之前的所有聊天记录，也可以包括目标问题之前的部分聊天记录。

还需要说明的是，本申请实施例不限定当前用户与目标用户的聊天场景，可以是图3所示的两人聊天场景，也可以是图4所示的多人聊天场景。另外，本申请实施例也不限定目标问题之前对话上文的具体内容，目标问题之前对话上文可以只包括当前用户与目标用户之间的聊天记录，还可以包括当前用户、目标用户以及聊天群中其他用户之间的聊天记录。

目标用户的用户标识是指能够表示目标用户身份特点的信息。作为示例，目标用户的用户标识可以是当前用户对目标用户的备注名称；而且，备注的名称可以包括当前用户对目标用户的昵称、当前用户与目标用户的关系、目标用户的身份等中的至少一种信息。例如，目标用户的用户标识可以是“妈妈”、“宝贝”、“姐姐”、“同事-张三”、“XX公司-李四”等。

此外，在一些情况下，当前用户可能未设定目标用户的备注名称，此时，目标用户的用户标识也可以为目标用户的用户名。例如，目标用户的用户标识可以是“帅斌”、“上善若水”等目标用户的用户名。

基于上述目标上文信息的相关介绍，在本申请实施例中，在输入法客户端接收到目标用户(例如，用户A)向当前用户(例如，用户B)提出的目标问题(例如，“我要睡觉了”)之后，输入法客户端会先获取目标上文信息，也就是，输入法客户端会先获取目标用户提出的目标问题、目标问题之前的对话上文以及目标用户的用户标识等信息，以便后续能够根据这些信息确定当前用户对目标问题的回复内容，其具体为：目标问题能够决定回复内容的实质内容，且目标问题之前的对话上文以及目标用户的用户标识均能够影响回复内容的回复语气。

S22：将目标上文信息输入预先训练的对话模型，根据该对话模型的输出结果确定该目标上文信息对应的至少一个回复语料。

本申请实施例中，在获取到目标上文信息之后，需要将目标上文信息输入到预先训练的对话模型，使得该对话模型能够根据目标上文信息对当前用户的回复内容进行预测并输出，此时可以根据该对话模型的输出结果确定该目标上文信息对应的一个或多个回复语料，以便后续当前用户能够从该一个或多个回复语料中选择其针对目标问题给出的回复内容。

需要说明的是，对话模型的输出结果可以是至少一个回复语料；也可以是不同回复语料及其对应的被选指标信息，其中，被选指标信息用于记录回复语料被当前用户选择的概率信息，而且，本申请实施例不限定被选指标信息的具体实施方式，例如，被选指标信息可以是回复预料的评分值。为了便于理解和解释，下面以对话模型的输出结果为至少一个回复语料为例进行说明。

作为示例，假设用户A与用户B聊天，如图3所示，则当用户A向用户B发送“我要睡觉了”时，使得用户B为当前用户且用户A为目标用户，则步骤S22具体可以为：将用户A提出的目标问题“我要睡觉了”、目标问题之前的对话上文“去吧去吧；那宝贝看剧吧，我玩游戏去了；……”、以及用户A的用户标识“宝贝”输入到预先训练的对话模型，使得该对话模型能够根据上述信息对用户B的回复内容进行预测，得到对话模型的输出结果“‘晚安，宝贝’、‘晚安，么么哒’、‘晚安，抱抱’、……”。此时，可以根据该对话模型的输出结果确定该目标上文信息对应的多个回复语料“1.晚安，宝贝2.晚安，么么哒3.晚安，抱抱4.……”。

可以理解的是，由于目标上文信息不仅包括目标用户提出的目标问题，还包括能够表征目标用户身份特点的目标问题之前的对话上文以及目标用户的用户标识，因而，在将目标上文信息输入预先训练的对话模型时，该对话模型能够从目标问题之前的对话上文以及目标用户的用户标识中提取出目标用户的身份特点，从而能够根据目标用户提出的目标问题以及目标用户的身份特点预测得到回复内容，使得该预测得到的回复内容不仅能够对目标问题进行答复，还能够使得回复内容的回复语气符合该目标用户的身份特点。

其中，对话模型是根据历史上文信息以及历史上文信息对应的历史回复训练得到的，而且历史上文信息包括历史用户提出的历史问题，历史问题之前的对话上文以及历史用户的用户标识。

历史上文信息是指不同用户之间的历史聊天相关信息。需要说明的是，本申请实施例不限定历史用户，可以是当前用户的历史聊天对象，也可以是其他用户的历史聊天对象。此外，本申请实施例不限定历史用户的用户标识，可以是当前用户对该历史用户的备注名称，也可以是其他用户对该历史用户的备注名称，还可以是该历史用户的用户名。例如，历史用户的用户标识为回复历史回复的用户对该历史用户的备注名称或者历史用户的用户名。

还需要说明的是，本申请实施例还提供了执行动作“将目标上文信息输入预先训练的对话模型”的具体实施方式、执行动作“根据对话模型的输出结果确定该目标上文信息对应的至少一个回复语料”的具体实施方式、以及对话模型的训练过程的具体实施方式，这些实施方式均将在下文中进行详细介绍。

S23：将至少一个回复语料作为候选项进行显示。

候选项用于记录在回复目标问题时可以使用的待选回复。

本申请实施例中，在获取到至少一个回复语料后，可以将该至少一个回复语料作为候选项进行显示，以便当前用户能够从显示的候选项中选择回复内容对目标问题进行回复，无需当前用户自身编辑回复内容，减轻了当前用户的编辑任务，节约当前用户的时间。

作为示例，假设用户A与用户B聊天，如图5所示，则当用户A向用户B发送“我要睡觉了”时，使得用户B为当前用户且用户A为目标用户，而且，当至少一个回复语料为“1.晚安，宝贝2.晚安，么么哒3.晚安，抱抱4.……”时，则步骤S23具体为：将至少一个回复语料“1.晚安，宝贝2.晚安，么么哒3.晚安，抱抱4.……”作为回复目标问题“我要睡觉了”时的候选项进行显示(如图5所示)，以便当前用户能够从这些候选项中直接选择回复内容进行回复(例如，如图6所示，当前用户选择了“晚安，宝贝”进行回复)。

通过上述实施例可知，输入法客户端在获取到目标上文信息之后，先将目标上文信息输入到预先训练的对话模型中对当前用户的回复内容进行预测，再根据对话模型的输出结果确定目标上文信息对应的至少一个回复语料，并将至少一个回复语料作为该目标上文信息中的候选项进行显示，以便后续当前用户能够利用显示的候选项进行回复。可见，在本申请实施例提供的方法中，输入法客户端能够根据目标上文信息并利用对话模型准确地预测出作为候选项的回复语料，使得当前用户可以直接利用该作为候选项的回复语料对目标用户进行回复即可，无需当前用户自己编辑内容进行回复。另外，由于目标上文信息不仅包括目标用户提出的目标问题，还包括目标问题之前的对话上文和目标用户的用户标识，因而，利用对话模型预测得到的作为候选项的回复语料不仅能够表示出对目标问题的回复内容，还能够表示出当前用户回复目标用户时所采用的回复语气，使得该作为候选项的回复语料能够符合该目标用户的身份特点，从而实现针对具有不同身份特点的目标用户给出具有不同语气的回复。

在本申请实施例一种可能的实现方式中，还提供了上述实施例中的执行动作“将目标上文信息输入预先训练的对话模型”的一种实现方式，如图7所示，该实施方式具体可以包括步骤S71-S72：

S71：将目标上文信息中的目标用户提出的目标问题、该目标问题之前的对话上文以及目标用户的用户标识分别转换为文本向量。

本申请实施例中，在获取到目标上文信息之后，需要先将目标上文信息进行向量化，也就是，将目标上文信息中的目标用户提出的目标问题、该目标问题之前的对话上文以及目标用户的用户标识进行向量化，以便得到目标用户提出的目标问题对应的文本向量、该目标问题之前的对话上文对应的文本向量以及目标用户的用户标识对应的文本向量，以便后续对话模型能够利用该文本向量进行回复内容的预测。

需要说明的是，本申请实施例不限定文本向量化算法，可以采用任一种现有或未来出现的能够将文本转换为文本向量的文本向量化算法。例如，文本向量化算法可以是word2vec，也可以是fasttext模型中的文本向量化层。

S72：将转换得到的目标上文信息对应的文本向量输入预先训练的对话模型，该对话模型用于将转换得到的目标上文信息对应的文本向量进行拼接得到第一隐藏层特征，将第一隐藏层特征进行全连接生成针对该目标问题的各个候选答案的评分值。

在本申请实施例中，在将目标上文信息对应的文本向量输入预先训练的对话模型后，该对话模型需要先将目标上文信息对应的文本向量进行拼接得到第一隐藏层特征，再将第一隐藏层特征进行全连接生成针对该目标问题的各个候选答案的评分值，以便后续能够根据各个候选答案的评分值确定出目标上文信息对应的至少一个回复语料。

需要说明的是，本申请实施例不限定“将目标上文信息对应的文本向量进行拼接得到第一隐藏层特征”的具体实施方式，可以采用任一种能够根据目标上文信息对应的文本向量得到第一隐藏层特征的隐藏信息计算过程，例如，该过程可以由fasttext模型中的隐藏层计算得到。

还需要说明的是，各个候选答案是从候选答案数据库中获取的，而且，各个候选答案可以是指候选答案数据库中的全部候选答案，也可以是指候选答案数据库中的部分候选答案。其中，候选答案数据库中包括多个问题所对应的各个回复答案，且该候选答案数据库是根据多个历史聊天记录构建完成的。另外，本申请实施例中不限定候选答案数据库的存储位置，可以存储在输入法客户端，也可以存储在输入法服务器，还可以存储在其他能够存储候选答案数据库的设备。

作为示例，假设候选答案数据库中包括第1个候选答案至第N个候选答案，则在将目标上文信息对应的文本向量输入预先训练的对话模型后，该对话模型需要先将目标上文信息对应的文本向量进行拼接得到第一隐藏层特征，再将第一隐藏层特征进行全连接生成针对该目标问题的第1个候选答案的评分值至第N个候选答案的评分值，以便后续能够根据第1个候选答案的评分值至第N个候选答案的评分值，确定出目标上文信息对应的至少一个回复语料。

在该实施方式中，在将目标上文信息对应的文本向量输入预先训练的对话模型后，对话模型可以依据转换得到的目标上文信息对应的文本向量对候选答案数据库中的各个候选答案进行评分，使得每个候选答案的评分值能够表征在利用每个候选答案进行回复时每个候选答案与目标上文信息的符合程度，以便后续能够根据各个候选答案的评分值确定出目标上文信息对应的至少一个回复语料。

在本申请实施例一种可能的实现方式中，还提供了上述实施例中的执行动作“根据该对话模型的输出结果确定该目标上文信息对应的至少一个回复语料”的一种实现方式，该实施方式具体可以为：获得对话模型输出的针对该目标问题的各个候选答案的评分值，选择评分值最高的至少一个候选答案作为目标上文信息对应的至少一个回复语料。

在本申请实施例中，在将目标上文信息输入预先训练的对话模型后，对话模型能够依据该目标上文信息预测得到针对目标问题的各个候选答案的评分值并输出，此时，可以通过比较对话模型输出的针对该目标问题的各个候选答案的评分值，得到评分值最高的至少一个候选答案，并将该评分值最高的至少一个候选答案作为目标上文信息对应的至少一个回复语料。

作为示例，当候选答案数据库中包括第1个候选答案至第N个候选答案，且第3个候选答案的评分值和第N-1个候选答案的评分值最高时，在将目标上文信息输入预先训练的对话模型后，对话模型能够依据该目标上文信息预测得到针对目标问题的第1个候选答案的评分值至第N个候选答案的评分值并输出，此时，可以比较第1个候选答案的评分值至第N个候选答案的评分值的大小，得到评分值最高的第3个候选答案的评分值和第N-1个候选答案，并将第3个候选答案的评分值和第N-1个候选答案作为目标上文信息对应的两个回复语料。

需要说明的是，上述示例是以“将评分最高的两个候选答案作为回复语料”为例进行说明的。然而，本申请实施例不限定“将评分最高的至少一个候选答案作为至少一个回复语料”的具体实施方式过程，例如，该实施过程可以为“将评分最高的M个候选答案作为M个回复语料”；也可以为“将评分高于预设分值的候选答案作为回复语料”，其中，预设分值可以预先设定，尤其可以根据应用场景设定。

可以理解的是，由于每个候选答案的评分值能够表征每个候选答案对目标上文信息的符合程度，因而，候选答案的评分值越高，则表示该候选答案对目标上文信息的符合程度越高，从而表示该候选答案被当前用户选择的概率越大。由此可知，在获取到对话模型输出的针对该目标问题的各个候选答案的评分值之后，可以通过选取评分值最高的至少一个候选答案作为目标上文信息对应的至少一个回复语料的方式，实现从多个候选答案中筛选出最符合目标上文信息的候选答案，使得被选出的候选答案能够最大概率的被当前用户选择使用。

在本申请实施例一种可能的实现方式中，还提供了一种对话模型的训练过程的实施方式，如图8所示，该实施方式具体可以包括步骤S81-S82：

S81：获取历史上文信息以及该历史上文信息对应的历史回复。

在本申请实施例中，在训练对话模型之前需要先获取训练数据，而且，该训练数据包括历史上文信息以及该历史上文信息对应的历史回复。由于历史上文信息和该历史上文信息对应的历史回复均是历史用户进行聊天时真实内容，因而，在将历史上文信息以及该历史上文信息对应的历史回复作为训练数据时，能够使得训练数据更符合实际用户聊天内容，从而使得基于该训练数据训练得到的对话模型能够更符合实际用户聊天内容，进而使得对话模型能够更准确地预测当前用户的回复内容。

S82：将历史上文信息输入初始对话模型，以在该初始对话模型输出的针对历史问题的各个候选答案的评分值中，该历史上文信息对应的历史回复的评分值最高作为训练目标，训练生成对话模型。

本申请实施例中，在将历史上文信息输入初始对话模型后，初始对话模型能够依据该历史上文信息进行预测，得到针对历史问题的各个候选答案的评分值。此时，需要判断评分值最高的候选答案是否是该历史上文信息对应的历史回复，若是，则结束训练并生成对话模型；若否，则调整对话模型中的参数继续进行训练。为了便于理解和解释步骤S82，下面结合步骤S821-S824进行说明。

在具体实现时，S82具体可以包括步骤S821-S824：

S821：将历史上文信息输入初始对话模型，得到针对历史问题的各个候选答案的评分值。

S822：判断评分值最高的候选答案是否是该历史上文信息对应的历史回复，若是，则执行步骤S823；若否，则执行步骤S824。

在本申请实施例中，若评分值最高的候选答案是该历史上文信息对应的历史回复，则表示当前对话模型能够依据历史上文信息准确地预测出该历史上文信息对应的历史回复，从而表示当前对话模型已完善无需继续训练；若评分值最高的候选答案不是该历史上文信息对应的历史回复，则表示当前对话模型无法依据历史上文信息准确地预测出该历史上文信息对应的历史回复，从而表示当前对话模型还不完善需要继续训练。

S823：结束对话模型的训练，并存储对话模型。

S824：更新对话模型中的参数，返回执行步骤S821。

在本申请实施例中，可以根据该初始对话模型输出的针对历史问题的各个候选答案的评分值、以及评分值最高的候选答案与该历史上文信息对应的历史回复之间的差距，更新对话模型中的参数。

需要说明的是，本申请实施例不限定对话模型的参数更新过程，例如，在本申请实施例中可以采用梯度回传的方法实现对话模型的参数更新过程。

在本申请实施例一种可能的实现方式中，还提供了上述实施例中的执行动作“将所述历史上文信息输入初始对话模型”的一种实施方式，如图9所示，该实施方式具体包括步骤S91-S92：

S91：将历史上文信息中的历史用户提出的历史问题、历史问题之前的对话上文以及该历史用户的用户标识分别转换为文本向量。

本申请实施例中，在获取到历史上文信息之后，需要先将历史上文信息进行向量化，也就是，将历史上文信息中的历史用户提出的历史问题、该历史问题之前的对话上文以及历史用户的用户标识进行向量化，以便得到历史用户提出的历史问题对应的文本向量、该历史问题之前的对话上文对应的文本向量以及历史用户的用户标识对应的文本向量，以便后续能够利用该文本向量进行回复内容的预测。

S92：将转换得到的历史上文信息对应的文本向量输入初始对话模型，该初始对话模型用于将转换得到的历史上文信息对应的文本向量进行拼接得到第二隐藏层特征，将该第二隐藏层特征进行全连接生成针对历史问题的各个候选答案的评分值。

在本申请实施例中，在将历史上文信息对应的文本向量输入预先训练的初始对话模型后，该初始对话模型需要先将历史上文信息对应的文本向量进行拼接得到第二隐藏层特征，再将第二隐藏层特征进行全连接生成针对该历史问题的各个候选答案的评分值，以便后续能够根据针对该历史问题的各个候选答案的评分值，判断评分值最高的候选答案是否为历史上文信息对应的历史回复。

需要说明的是，本申请实施例不限定“将历史上文信息对应的文本向量进行拼接得到第二隐藏层特征”的具体实施方式，可以采用任一种能够根据历史上文信息对应的文本向量得到第二隐藏层特征的隐藏信息计算过程，例如，该过程可以由fasttext模型中的隐藏层计算得到。

在该实施方式中，在将历史上文信息对应的文本向量输入预先训练的对话模型后，对话模型可以依据转换得到的历史上文信息对应的文本向量对候选答案数据库中的各个候选答案进行评分，使得每个候选答案的评分值能够表征在利用每个候选答案进行回复时每个候选答案与历史上文信息的符合程度，以便后续能够根据针对该历史问题的各个候选答案的评分值，判断评分值最高的候选答案是否为历史上文信息对应的历史回复。

基于上述提供的生成回复消息的方法的具体实施方式可知，在本申请实施例中，能够根据目标上文信息并利用对话模型准确地预测出作为候选项的回复语料，并将该作为候选项的回复语料直接显示给用户，使得用户能够直接利用显示的作为候选项的回复语料进行回复即可，无需用户自己编辑回复内容，节省用户时间。另外，该方法还能够根据目标上文信息中所携带的目标用户的用户标识确定聊天对象的身份特点，并能够利用对话模型预测得到能够符合该目标用户的身份特点的作为候选项的回复语料，并将该作为候选项的回复语料直接显示给用户，使得用户能够直接利用显示的作为候选项的回复语料进行回复即可，无需用户自己依据聊天对象的身份特点编辑回复内容，节省用户时间；而且，还实现针对具有不同身份特点的目标用户给出不同语气的回复，且针对具有相同或相似身份特点的目标用户给出相同语气的回复。

基于上述方法实施例提供的生成回复消息的方法，本申请实施例还提供了一种生成回复消息的装置，下面结合附图进行解释和说明。

装置实施例

参见图10，该图为本申请实施例提供的生成回复消息的装置结构示意图。

本申请实施例提供的生成回复消息的装置，包括：

第一获取单元101，用于获取目标上文信息，所述目标上文信息包括目标用户提出的目标问题、所述目标问题之前的对话上文以及所述目标用户的用户标识；

回复预测单元102，用于将所述目标上文信息输入预先训练的对话模型，根据所述对话模型的输出结果确定所述目标上文信息对应的至少一个回复语料；所述对话模型是根据历史上文信息以及所述历史上文信息对应的历史回复训练得到的，所述历史上文信息包括历史用户提出的历史问题，所述历史问题之前的对话上文以及所述历史用户的用户标识；

回复显示单元103，用于将所述至少一个回复语料作为候选项显示。

在一种可能的实现方式中，所述回复预测单元102，包括：

在一种可能的实现方式中，所述目标用户的用户标识为当前用户对所述目标用户的备注名称或者所述目标用户的用户名。

在一种可能的实现方式中，所述装置还包括：

在一种可能的实现方式中，所述模型训练单元，包括：

在一种可能的实现方式中，所述历史用户的用户标识为回复所述历史回复的用户对所述历史用户的备注名称或者所述历史用户的用户名。

需要说明的是，本实施例中各个单元的具体实现可以参见上述方法实施例，本实施例在此不再赘述。

图11示出了一种输入装置1100的框图。例如，装置1100可以是移动电话，计算机，数字广播终端，消息收发设备，游戏控制台，平板设备，医疗设备，健身设备，个人数字助理等。

参照图11，装置1100可以包括以下一个或多个组件：处理组件1102，存储器1104，电源组件1106，多媒体组件1108，音频组件1110，输入/输出(I/O)的接口1112，传感器组件1114，以及通信组件1116。

处理组件1102通常控制装置1100的整体操作，诸如与显示，电话呼叫，数据通信，相机操作和记录操作相关联的操作。处理元件1102可以包括一个或多个处理器1120来执行指令，以完成上述的方法的全部或部分步骤。此外，处理组件1102可以包括一个或多个模块，便于处理组件1102和其他组件之间的交互。例如，处理部件1102可以包括多媒体模块，以方便多媒体组件1108和处理组件1102之间的交互。

存储器1104被配置为存储各种类型的数据以支持在设备1100的操作。这些数据的示例包括用于在装置1100上操作的任何应用程序或方法的指令，联系人数据，电话簿数据，消息，图片，视频等。存储器1104可以由任何类型的易失性或非易失性存储设备或者它们的组合实现，如静态随机存取存储器(SRAM)，电可擦除可编程只读存储器(EEPROM)，可擦除可编程只读存储器(EPROM)，可编程只读存储器(PROM)，只读存储器(ROM)，磁存储器，快闪存储器，磁盘或光盘。

电源组件1106为装置1100的各种组件提供电力。电源组件1106可以包括电源管理系统，一个或多个电源，及其他与为装置1100生成、管理和分配电力相关联的组件。

多媒体组件1108包括在所述装置1100和用户之间的提供一个输出接口的屏幕。在一些实施例中，屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板，屏幕可以被实现为触摸屏，以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界，而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中，多媒体组件1108包括一个前置摄像头和/或后置摄像头。当设备1100处于操作模式，如拍摄模式或视频模式时，前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。

音频组件1110被配置为输出和/或输入音频信号。例如，音频组件1110包括一个麦克风(MIC)，当装置1100处于操作模式，如呼叫模式、记录模式和语音识别模式时，麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器1104或经由通信组件1116发送。在一些实施例中，音频组件1110还包括一个扬声器，用于输出音频信号。

I/O接口为处理组件1102和外围接口模块之间提供接口，上述外围接口模块可以是键盘，点击轮，按钮等。这些按钮可包括但不限于：主页按钮、音量按钮、启动按钮和锁定按钮。

传感器组件1114包括一个或多个传感器，用于为装置1100提供各个方面的状态评估。例如，传感器组件1114可以检测到设备1100的打开/关闭状态，组件的相对定位，例如所述组件为装置1100的显示器和小键盘，传感器组件1114还可以检测装置1100或装置1100一个组件的位置改变，用户与装置1100接触的存在或不存在，装置1100方位或加速/减速和装置1100的温度变化。传感器组件1114可以包括接近传感器，被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件1114还可以包括光传感器，如CMOS或CCD图像传感器，用于在成像应用中使用。在一些实施例中，该传感器组件1114还可以包括加速度传感器，陀螺仪传感器，磁传感器，压力传感器或温度传感器。

通信组件1116被配置为便于装置1100和其他设备之间有线或无线方式的通信。装置1100可以接入基于通信标准的无线网络，如WiFi，2G或3G，或它们的组合。在一个示例性实施例中，通信部件1116经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中，所述通信部件1116还包括近场通信(NFC)模块，以促进短程通信。例如，在NFC模块可基于射频识别(RFID)技术，红外数据协会(IrDA)技术，超宽带(UWB)技术，蓝牙(BT)技术和其他技术来实现。

在示例性实施例中，装置1100可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现，用于执行下述方法：

将所述至少一个回复语料作为候选项显示。

可选的，所述将所述目标上文信息输入预先训练的对话模型，包括：

可选的，所述根据所述对话模型的输出结果确定所述目标上文信息对应的至少一个回复语料，包括：

可选的，所述目标用户的用户标识为当前用户对所述目标用户的备注名称或者所述目标用户的用户名。

可选的，所述方法还包括：

获取历史上文信息以及所述历史上文信息对应的历史回复；

可选的，所述将所述历史上文信息输入初始对话模型，包括：

可选的，所述历史用户的用户标识为回复所述历史回复的用户对所述历史用户的备注名称或者所述历史用户的用户名。

一种非临时性计算机可读存储介质，当所述存储介质中的指令由移动终端的处理器执行时，使得移动终端能够执行显示方法，所述方法包括：

将所述至少一个回复语料作为候选项显示。

可选的，所述方法还包括：

获取历史上文信息以及所述历史上文信息对应的历史回复；

图12是本发明实施例中服务器的结构示意图。该服务器1200可因配置或性能不同而产生比较大的差异，可以包括一个或一个以上中央处理器(central processing units，CPU)1222(例如，一个或一个以上处理器)和存储器1232，一个或一个以上存储应用程序1242或数据1244的存储介质1230(例如一个或一个以上海量存储设备)。其中，存储器1232和存储介质1230可以是短暂存储或持久存储。存储在存储介质1230的程序可以包括一个或一个以上模块(图示没标出)，每个模块可以包括对服务器中的一系列指令操作。更进一步地，中央处理器1222可以设置为与存储介质1230通信，在服务器1200上执行存储介质1230中的一系列指令操作。

终端1200还可以包括一个或一个以上电源1226，一个或一个以上有线或无线网络接口1250，一个或一个以上输入输出接口1256，一个或一个以上键盘1256，和/或，一个或一个以上操作系统1241，例如Windows ServerTM，Mac OS XTM，UnixTM,LinuxTM，FreeBSDTM等等。

需要说明的是，本说明书中各个实施例采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似部分互相参见即可。对于实施例公开的系统或装置而言，由于其与实施例公开的方法相对应，所以描述的比较简单，相关之处参见方法部分说明即可。

应当理解，在本申请中，“至少一个(项)”是指一个或者多个，“多个”是指两个或两个以上。“和/或”，用于描述关联对象的关联关系，表示可以存在三种关系，例如，“A和/或B”可以表示：只存在A，只存在B以及同时存在A和B三种情况，其中A，B可以是单数或者复数。字符“/”一般表示前后关联对象是一种“或”的关系。“以下至少一项(个)”或其类似表达，是指这些项中的任意组合，包括单项(个)或复数项(个)的任意组合。例如，a，b或c中的至少一项(个)，可以表示：a，b，c，“a和b”，“a和c”，“b和c”，或“a和b和c”，其中a，b，c可以是单个，也可以是多个。

还需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块，或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。

对所公开的实施例的上述说明，使本领域专业技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的，本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下，在其它实施例中实现。因此，本申请将不会被限制于本文所示的这些实施例，而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims

1.一种生成回复消息的方法，其特征在于，所述方法包括：

将所述至少一个回复语料作为候选项显示。

2.根据权利要求1所述的方法，其特征在于，所述将所述目标上文信息输入预先训练的对话模型，包括：

3.根据权利要求1或2所述的方法，其特征在于，所述根据所述对话模型的输出结果确定所述目标上文信息对应的至少一个回复语料，包括：

4.根据权利要求1或2所述的方法，其特征在于，所述目标用户的用户标识为当前用户对所述目标用户的备注名称或者所述目标用户的用户名。

5.根据权利要求1或2所述的方法，其特征在于，所述方法还包括：

获取历史上文信息以及所述历史上文信息对应的历史回复；

6.根据权利要求5所述的方法，其特征在于，所述将所述历史上文信息输入初始对话模型，包括：

7.根据权利要求5所述的方法，其特征在于，所述历史用户的用户标识为回复所述历史回复的用户对所述历史用户的备注名称或者所述历史用户的用户名。

8.一种生成回复消息的装置，其特征在于，所述装置包括：

9.一种用于生成回复消息的装置，其特征在于，包括有存储器，以及一个或者一个以上的程序，其中一个或者一个以上程序存储于存储器中，且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令：

将所述至少一个回复语料作为候选项显示。

10.一种计算机可读介质，其上存储有指令，当由一个或多个处理器执行时，使得装置执行权利要求1至7中一个或多个所述的生成回复消息的方法。